当前位置 > CPDA数据分析师 > “数”业专攻 > Datahoop2.0为数据思维插上翅膀

Datahoop2.0为数据思维插上翅膀

来源:数据分析师 CPDA | 时间:2018-09-18 | 作者:admin

图片1 7 - Datahoop2.0为数据思维插上翅膀

 

一、产品概况

Datahoop2.0颠覆了传统意义上专属于数据分析师的“数据分析”概念,实现了数据“民主化”,让每个人都可以对手中的数据进行分析,做出决策,实现把数据变成黄金的可能。

 

Datahoop2.0功能十分强大,海量可视化图表,分分钟将您的抽象数据转化成直观可见的图形和表格;数据分析师共享中心为数据分析师提供了分享图文、数据和算法的平台;项目中心为用户提供实时在线求助和项目资源服务;个人中心为每位用户提供了在线存储功能。

 

Datahoop2.0不仅功能强大,而且无技术壁垒,具有广泛的行业覆盖和人群覆盖。不管您是银行高管还是电商业务员,IT精英还是金融白领,只要您有数据分析的需要,Datahoop2.0都能够为您所用,让您手上的数据产生价值,帮助您做出决策,走向成功。

 

图片2 6 - Datahoop2.0为数据思维插上翅膀

 

二、主要功能模块

Datahoop2.0数据分析平台拥有多类型的数据源、完善的数据处理方法、海量可视化图表以及灵活方便的搭建算法模型。

 

1.数据源:

Datahoop2.0数据分析平台支持所有常用数据格式,包括Excel、txt、csv等,同时也支持连接数据库类型的文件,如 MySQL、PostgreSQL和ORACLE等;Datahoop2.0数据分析平台还支持链接服务器Microsoft SQL Server 2008 R2、Microsoft SQL Server 2012、HIVE、PostgreSQL和ORACLE等数据库。在使用平台时,必须保证数据库所在的服务器有一个对外开放的公网IP;Datahoop2.0数据分析平台还能读取非关系型数据库MongoDB。

 

2.数据处理:

在数据挖掘中,海量的原始数据中存在着大量的不完整、不一致、或异常的数据,这严重影响数据挖掘建模的执行效率,甚至可能导致结果的偏差。因此,进行数据清洗尤为重要。在数据清洗完成后,才可以接着进行数据集成、变换、规约等一系列处理。

 

Datahoop2.0数据分析平台提供的数据预处理功能主要包括数据清洗、数据集成、数据规约和数据变换等。其中数据清洗包括空缺值处理、分箱去噪,数据集成包括表合并,数据变换包括标准化、降维、相关性等,数据规约包括统计分析,数据探索包括关联分析、相关系数矩阵、对应分析等。

 

平台能够对数据进行可视化操作处理。它一方面很像传统的Excel软件,具有简单的数理统计功能,但另一方面,其工作方式更像数据库——其并不是仅仅处理单独的单元格,而是处理列或字段。这意味着Datahoop2.0在探索、清洗和整合数据方面的功能也十分强大。数据预处理部分能较好地载入并显示数据,数据显示较宽时,可使用水平滑动条进行调整。在数据量很大的情况下,每页的显示条数也可灵活改动,可以说是非常方便。

 

3.算法:

Datahoop2.0几乎涵盖了所有数据挖掘算法,其中监督学习算法有SVM、神经网络、逻辑回归、朴素贝叶斯、决策 树、Adaboost、GBDT、随机森林、KNN、时间序列等,非监督学习算法有K-Means、K-Medians、层次聚类等。

 

此外,Datahoop2.0还提供了大多数传统的统计分析算法,如(列举几个)等。在Datahoop2.0中,算法一方面以Python模块的形式呈现,同时,为了方便用户使用,Datahoop2.0还提供了图形用户界面(GUI),用户可以通过使用预先定义好的多种模块组成工作流,来完成复杂的数据挖掘工作。Datahoop2.0也将根据行业和客户需求持续更新。

 

4.可视化:

①多图表支持功能Datahoop2.0支持多种图表,常见的有表格、折线图、簇状柱形图、条形图、饼图等,酷炫的有漏斗图、词云、瀑布图、雷达图、双轴图、散点图、堆积柱/条形图、百分比堆积柱/条形图等,还有精美的地图、热力图、气泡图随您选。

 

②自由拖拽在Datahoop2.0的可视化分析台上,用户可以自由进行数据的拖拽,并对数据进行筛选、条数限制、数据公式、颜色设置等操作,最终生成可视化图表。数据筛选器帮助用户灵活选择和调 整图表生成条件,对展示的数据区间进行细分和深层分析。

 

5.产品特色

多数据源支持Datahoop2.0支持Excel、CSV、TXT等文本格式数据,也支持链接MySQL、SQLSever、Hive等常用大型数据库。用户只需上传数据或配置数据库,即可根据需要进行分析。便捷的拖拽效果、清晰的页面导航,让您分分钟完成数据分析,发掘数据价值

完善的预处理方法在数据分析的过程中,用户获取到的海量数据中必然会有脏数据,并不能直接用来分析。为了让用户不必在数据预处理上耗费过多精力,Datahoop2.0提供了完善的数据预处理方法。用户可根据需要进行选择,点击“确定”即可完成数据清洗、数据集成、数据变换、数据规约以及数据探索等数据预处理过程。

 

图片3 7 1024x578 - Datahoop2.0为数据思维插上翅膀

 

海量可视化图表Datahoop2.0拥有海量可视化图表,不管是普通的柱形图、饼状图、条形图、折线图还是酷炫的词云图、气泡图、雷达图、漏斗图等,只需拖拽数据,选取所需的图表,即可完成。Datahoop2.0还支持数据筛选、颜色设置等多种功能。

 

算法模型一次建模多次应用,业务人员也能进行数据分析,深度挖掘数据价值。Datahoop2.0同时提供WebIDE,为会敲算法的您提供了线上编辑算法、保存并形成自己的专属模块的功能,一次编辑完成,再次使用时直接拖拽调用。

 

图片4 4 1024x530 - Datahoop2.0为数据思维插上翅膀

 

共享中心

数据价值很大?代码非常完美?经验十分丰富?来Datahoop2.0共享中心,分享您的数据、代码和经验,为苦于寻找、努力钻研的小伙伴提供帮助,同经验丰富、分析大咖们切磋交流。数据查找困难?代码总是报错?分析经验不足?来Datahoop2.0共享中心,找你所想,查你所盼,总有那么一条分享满足你的需求。

项目中心找项目?上Datahoop2.0项目中心,针对不同领域或行业

的各种项目,接到你手软!工作量大?上Datahoop2.0项目中心,不愁没有解决方

案,同时帮你认识更多大牛!自建算法:

资深数据分析师的您,把您的算法作品分享到平台,让平台给您整合为价值无限的软资产,也让您像玩乐高玩具一样把您的算法用起来!

 

图片5 4 - Datahoop2.0为数据思维插上翅膀

 

集大数据分析处理平台和社交平台于一体的Datahoop2.0,是一款真正意义上属于每个人的分析工具。其功能之强大,数据体量及类别之多、算法模型涵盖之广,无与伦比!