当前位置 > CPDA数据分析师 > “数”业专攻 > 2018年7款最佳免费数据分析工具

2018年7款最佳免费数据分析工具

来源:数据分析师 CPDA | 时间:2018-05-15 | 作者:admin

1、DataMelt
DataMelt又叫DMelt,这款计算平台用于统计分析庞大数据和科学可视化。该软件最常用于自然科学、工程以及金融市场的建模和分析。它支持许多编程语言,包括Python、 BeanShell、Groovy、Ruby、Java及其他语言。

企业组织可通过动态脚本来访问大型库,包括面向计算和可视化的40000多个Java类和500个Python模块。更高级的功能需要开发者许可证或商业许可证,但是免费版DataMelt包括探索、分析和可视化数据所必要的许多关键功能。

DataMelt可在Windows、Linux、macOS和Android设备上运行。

 

2、KNIME分析平台
KNIME分析平台旨在帮助企业通过可视化编程来处理、分析和建模数据。该软件包括1000多个模块、数百个随时可运行的示例和众多集成工具,帮助用户借助机器学习来发现隐藏在数据中的潜在洞察力,并预测未来。

KNIME让企业能够拖放活动之间的连接点,无需编写代码。该数据分析工具使用单一的可视化工作流程,支持简单文本文件、数据库、文档、图像、网络和基于Hadoop的数据之间的数据融合。KNIME分析平台是开源工具,每年发布两个新版本。

KNIME适用于Windows、macOS和Linux设备。

 

3、OpenRefine
OpenRefine前身是Google OpenRefine,可帮助企业处理凌乱的数据。谷歌在2012年停止支持该项目,但该软件并未停供,由自愿者定期更新。OpenRefine可对数据执行众多任务,包括清理、转换和格式化数据,让数据更适合数据分析和探索。该工具还让用户能够从外部Web服务获取数据,对来自各数据源的数据进行调和及匹配。

OpenRefine不是最适合大型数据库的工具,但对许多企业来说仍是一种重要的、备受好评的选择,这是由于分析员们经常把大量的时间花在清理数据用于预测模型上。

OpenRefine可以下载到Windows、macOS和Linux上。

 

4、Orange
Orange是一款开源数据分析和可视化工具,在斯洛文尼亚的卢布尔雅那大学开发而成。用户可以通过可视化编程或Python脚本在终端窗口中挖掘数据;探索静态分布、箱形图或散点图;以及利用决策图、层次聚类、热图和线性预测,更深入地钻研数据。

Orange的图形用户界面让用户能够专注于探索性数据分析,而不是编写代码。该工具还拥有用于机器学习的组件和扩展数据挖掘功能的附件,以执行自然语言处理、文本挖掘、生物信息学、网络分析以及相关的规则挖掘。

Orange支持Windows、macOS和Linux。

 

5、R
R编程语言广泛用于统计方法中的研究。企业组织还能充分利用用于数据处理、计算和图形显示的集成软件套件。关键的统计功能包括:线性和非线性建模、经典统计测试、时间序列分析、分类和聚类。

R在Unix、Windows和macOS上运行。

 

 

6、Tableau Public
Tableau Public是一款数据分析和可视化软件,让用户能够向Web发布交互式数据。免费版Tableau仅限于1GB的数据存储和100万行数据。Tableau Public具有简洁性和界面直观的优点,因而成为最流行的数据分析工具之一。

Tableau Public可挖掘来自Google Sheets、微软Excel、CSV文件、JSON文件、静态文件、空间文件、Web数据连接件和OData的数据。用户可以生成在社区媒体上共享或嵌入到网站上供公众访问的交互式图形、图表和地图。Tableau Public可以下载到Windows和macOS上。

 

 

7、Trifacta Wrangler
Trifacta Wrangler是另一款旨在帮助数据分析员清理和准备来自诸多数据源的凌乱数据的软件。一旦数据集导入到Trifacta Wrangler,该软件就会自动整理数据,并自动确定结构。机器学习算法可建议常见的转换和聚合,有助于准备数据用于更详细的分析。

Trifacta Wrangler可从微软Excel、JSON文件和原始的CSV文件导入数据。该工具还可分析数据,表明多少百分比的行存在值缺失、不匹配或不一致的情况,并按类型对数据进行直观地分类,比如日期或时间、字符串或与每个数据点有关的IP地址。Trifacta Wrangler仅限于100MB数据,可以下载到Windows和macOS设备上。

 

CPDA其他相关文章:

1.数据分析师常用工具有哪些?初学者必看

2.常用的一些数据分析工具