当前位置 > CPDA数据分析师 > “数”业专攻 > 这些探索性数据分析工具,适用于编码能力不佳的人

这些探索性数据分析工具,适用于编码能力不佳的人

来源:数据分析师 CPDA | 时间:2019-01-17 | 作者:admin

我们都有与生俱来的特殊才能,我们发现并开始相信自己只是个时间问题。我们都有局限性,但我们应该就此止步吗?不。

 

类似于一个不知道游泳的人,但被粗暴地推入深海,他以某种方式拯救了自己免于溺水,但结果却吞下了大量的咸水。回头开始嘲笑自己,因为,本可以在之前就选择有很多方式学习游泳,免于受罪。

 

在企业中类似这样的事件有很多,在企业中这种现象欠缺的是分析、数据分析;

 

之前我们说过很多关于数据分析方面的知识,那接下来我们将叙说:即使编码能力有限,但也可以做数据分析师:

 

现在,市场上有很多免费的工具,使用起来非常有趣。这些工具不需要明确编写代码,简单的拖放单击就可以完成数据分析这项工作。

 

excel - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Excel /电子表格

 

如果你正在向数据分析过渡,或者已经入行很多年,你就会知道,即使经过无数年,excel仍然是分析行业不可或缺的一部分。即使在今天,分析项目中面临的大多数问题都是使用这个软件解决的。有了比以往更大的社区支持、教程和免费资源,学习这个工具变得非常容易。

 

它支持所有重要功能,如汇总数据,可视化数据,数据争用等,这些功能足以从各个角度检查数据。无论你知道多少工具,excel都必须在你的军械库中出现。虽然,微软excel已付,但你仍然可以尝试各种其他电子表格工具,如开放式办公室,谷歌文档,这当然值得一试!

Trifacta - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Trifacta

 

Trifacta的Wrangler工具正在挑战传统的数据清理和操作方法。由于excel对数据大小有限制,因此该工具没有这样的界限,你可以安全地处理大数据集。该工具具有令人难以置信的功能,如图表建议、内置算法、分析洞察,你可以使用它立即生成报告。它是一个智能工具,专注于更快地解决业务问题,从而使我们能够更有效地进行数据相关的练习。

这种开源工具的可用性使我们感到更加自信和支持,世界各地也有优秀人才,他们正在极其努力地改善我们的生活。

 

Rapid Miner - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Rapid Miner

 

该工具成为2016年Gartner高级分析魔力象限的领导者。是的,它不仅仅是一个数据清理工具。它扩展了建立机器学习模型的专业知识。是的,它包含我们经常使用的所有ML算法。它不仅仅是一个GUI,还扩展了对使用Python和R进行模型构建的人的支持。

 

这个工具在2016年高德纳(Gartner)的高级分析魔力象限(Magic Quadrant)中脱颖而出。它不仅仅是一个数据清理工具。它扩展了在建立机器学习模型方面的专业知识。它还扩展了对使用Python & R构建模型支持。

 

它以其非凡的能力继续吸引着世界各地的人们。最重要的是,它声称能够提供闪电级的分析体验。他们的产品线有几个产品是为大数据、可视化、模型部署而构建的。简而言之,对于任何需要执行从数据加载到模型部署的所有任务的业务,它都是一个不错的工具。

 

Rattle GUI - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Rattle GUI 

 

如果你试着用R,但不知道怎么回事,Rattle应该是你的首选。这个GUI是在R上构建的,通过输入install.packages(“Rattle”)、library(Rattle)和R中启动。因此,要使用Rattle,你必须安装R。它也不仅仅是数据挖掘工具,rattl支持各种ML算法,如Tree、SVM、boost、Neural Net、Survival、Linear models等。

 

Qlikview - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Qlikview

 

Qlikview是全球商业智能行业最受欢迎的工具之一。获得业务见解并以令人敬畏的方式呈现它,是该工具的功能。凭借其最先进的可视化功能,可以在处理数据时获得的控制量令人惊讶。它有一个内置的推荐引擎,可以在处理数据集时不时更新你的最佳可视化方法。

 

但是,它不是统计软件,Qlikview在探索数据,趋势和洞察力方面令人难以置信,但它在统计上无法证明任何事情。

 

Weka - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Weka 

 

使用Weka的一个优点是它易于学习。作为一种机器学习工具,它的界面非常直观,可以让你快速完成工作。它提供了数据预处理,分类,回归,聚类,关联规则和可视化的选项。你可以使用Weka实现模型构建时考虑的大多数步骤。它建立在Java之上。

 

它主要是为了在Wakaito大学的研究目的而设计的,但后来它被全世界越来越多的人所接受。然而,加班我还没有看到像R和Python那样热情的weka社区。下面列出的教程可以为你提供更多帮助。

 

KNIME - 这些探索性数据分析工具,适用于编码能力不佳的人

 

KNIME 

与RapidMiner类似,KNIME提供了一个用于分析数据的开源分析平台,该平台可以在以后部署,使用其他支持性KNIME产品进行扩展。该工具具有丰富的数据混合,可视化和先进的机器学习算法功能。是的,使用此工具你也可以构建模型。虽然,关于这个工具还没有足够的讨论,但考虑到它的艺术设计,还是认为它很快就会引起人们的关注。

 

Orange - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Orange

这个工具听起来很酷,但它的设计目的是生成交互式数据可视化和数据挖掘任务。有足够的youtube教程来学习这个工具。它有一个广泛的数据挖掘任务库,包括所有分类、回归、聚类方法。此外,在数据分析过程中形成的多用途可视化使我们能够更紧密地理解数据。

 

Tableau Public - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Tableau Public

 

Tableau是一种数据可视化软件。我们可以说,画面和qlikview是商业智能海洋中最强大的鲨鱼。优越性的比较永无止境。它是一个快速的可视化软件,让你可以使用各种可能的图表来探索数据和每次观察。这是智能算法自我解决的数据类型,可用的最佳方法等。

 

如果你想要实时了解数据,可以使用tableau完成工作。在某种程度上,tableau为数据赋予了丰富多彩的生命。

 

Data Wrapper - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Data Wrapper

 

这是一个快速可视化软件。下次,当有人在你身边团队被分配Bl工作,他/她不知道该做什么,这个软件是一个相当大的选择。可视化桶由线形图、条形图、柱状图、饼状图、堆叠条形图和地图组成。所以,它是一个基本的软件,不能与tableau和glikview这样的巨头相比。

 

Data Science Studio DSS - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Data Science Studio (DSS)

 

它是一个功能强大的工具,旨在连接技术,业务和数据。它有两个部分:编码和非编码。对于任何旨在开发,构建,部署和扩展网络模型的组织而言,它都是一个完整的软件包。DSS还足以创建智能数据应用程序以解决实际问题。它包含有助于团队整合项目的功能。在所有功能中,最有趣的部分是,你可以在DSS中重现你的工作,因为系统中的每个操作都通过集成的GIT存储库进行版本控制。

 

OpenRefine - 这些探索性数据分析工具,适用于编码能力不佳的人

 

OpenRefine

 

它起初是谷歌精炼,但由于不清楚的原因,谷歌的这一性能直线下降。但是,此工具仍可重命名为Open Refine,在慷慨的开源工具列表中,openrefine专门用于清理、转换和塑造杂乱的数据,以达到预测建模的目的。有趣的是,在模型构建过程中,数据分析师80%的时间用于数据清理,这是事实,但使用openrefine,分析师不仅可以节省时间,还可以将其用于高效工作。

 

Talend - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Talend

 

如今的决策主要是由数据驱动的。经理和专业人士不再做出基于直觉的决定。他们需要一种可以快速帮助他们的工具。Talend可以帮助他们探索数据并支持他们的决策。准确地说,它是一种能够清理、转换和可视化数据的数据协作工具。

 

此外,它还提供了一个有趣的自动化功能,你可以在新数据集上保存和重做以前的任务。此功能是独一无二的,并且在许多工具中都找不到。此外,它还可以进行自动发现,为用户提供智能建议,以增强数据分析。

 

Data Preparator - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Data Preparator

 

这个工具是基于Java构建的,用于帮助我们进行数据探索、清理和分析。它包含用于离散化、编号、缩放、属性选择、缺失值、离群值、统计、可视化、平衡、抽样、行选择和其他一些任务的各种内置包。它的古尔是直观和简单的理解。一旦你开始做这件事,可以肯定你不会花很多时间来弄清楚如何去做。

 

该工具的独特优势在于,用于分析的数据集不会存储在计算机内存中。这意味着你可以处理大型数据集而不会出现任何速度或内存问题。

 

DataCracker - 这些探索性数据分析工具,适用于编码能力不佳的人

 

DataCracker  

 

这是一个专门研究调查数据的数据分析软件。许多公司会做调查,但很难进行统计分析,调查的数据永远不干净,其中包含许多缺失和不适当的价值。这个工具减少了我们的痛苦,增强了我们处理混乱数据的经验。

 

Data Applied - 这些探索性数据分析工具,适用于编码能力不佳的人

 

Data Applied

 

这个强大的交互工具用于构建、共享和设计数据分析报告。在大型数据集上创建可视化有时会很麻烦,但是这个工具在使用树映射可视化大量数据方面非常健壮。与上述所有工具一样,它具有数据转换、统计分析、异常检测等功能。使用能够自动从原始数据中提取有价值的知识的数据挖掘工具,会惊奇地发现,对于数据分析师来说,这些非编程工具不亚于R或Python。

 

 

 

Tanagra Project 

 

你可能不喜欢它,因为是老式的UI,但这个免费的数据挖掘软件旨在建立机器学习模型。TanagraProject 最初是作为学术和研究目的的免费软件,作为一个开源项目,它为你提供了足够的空间来设计自己的算法并做出贡献。

 

除了监督学习算法,它还支持诸如聚类、阶乘分析、参数和非参数统计、关联规则、特征选择和构造算法等范例。它的一些局限性包括不能获得广泛的数据源、直接访问数据仓库和数据库、数据清理、交互式利用等。

 

H2o - 这些探索性数据分析工具,适用于编码能力不佳的人

 

H2o

 

H20是当今分析行业最流行的软件之一。不仅仅是数据分析,你可以在短时间内建立先进的机器学习模型。社区的支持是巨大的,因此学习这个工具不需要担心。