来源:数据分析师 CPDA | 时间:2018-09-18 | 作者:admin
一、产品概况
Datahoop2.0颠覆了传统意义上专属于数据分析师的“数据分析”概念,实现了数据“民主化”,让每个人都可以对手中的数据进行分析,做出决策,实现把数据变成黄金的可能。
Datahoop2.0功能十分强大,海量可视化图表,分分钟将您的抽象数据转化成直观可见的图形和表格;数据分析师共享中心为数据分析师提供了分享图文、数据和算法的平台;项目中心为用户提供实时在线求助和项目资源服务;个人中心为每位用户提供了在线存储功能。
Datahoop2.0不仅功能强大,而且无技术壁垒,具有广泛的行业覆盖和人群覆盖。不管您是银行高管还是电商业务员,IT精英还是金融白领,只要您有数据分析的需要,Datahoop2.0都能够为您所用,让您手上的数据产生价值,帮助您做出决策,走向成功。
二、主要功能模块
Datahoop2.0数据分析平台拥有多类型的数据源、完善的数据处理方法、海量可视化图表以及灵活方便的搭建算法模型。
1.数据源:
Datahoop2.0数据分析平台支持所有常用数据格式,包括Excel、txt、csv等,同时也支持连接数据库类型的文件,如 MySQL、PostgreSQL和ORACLE等;Datahoop2.0数据分析平台还支持链接服务器Microsoft SQL Server 2008 R2、Microsoft SQL Server 2012、HIVE、PostgreSQL和ORACLE等数据库。在使用平台时,必须保证数据库所在的服务器有一个对外开放的公网IP;Datahoop2.0数据分析平台还能读取非关系型数据库MongoDB。
2.数据处理:
在数据挖掘中,海量的原始数据中存在着大量的不完整、不一致、或异常的数据,这严重影响数据挖掘建模的执行效率,甚至可能导致结果的偏差。因此,进行数据清洗尤为重要。在数据清洗完成后,才可以接着进行数据集成、变换、规约等一系列处理。
Datahoop2.0数据分析平台提供的数据预处理功能主要包括数据清洗、数据集成、数据规约和数据变换等。其中数据清洗包括空缺值处理、分箱去噪,数据集成包括表合并,数据变换包括标准化、降维、相关性等,数据规约包括统计分析,数据探索包括关联分析、相关系数矩阵、对应分析等。
平台能够对数据进行可视化操作处理。它一方面很像传统的Excel软件,具有简单的数理统计功能,但另一方面,其工作方式更像数据库——其并不是仅仅处理单独的单元格,而是处理列或字段。这意味着Datahoop2.0在探索、清洗和整合数据方面的功能也十分强大。数据预处理部分能较好地载入并显示数据,数据显示较宽时,可使用水平滑动条进行调整。在数据量很大的情况下,每页的显示条数也可灵活改动,可以说是非常方便。
3.算法:
Datahoop2.0几乎涵盖了所有数据挖掘算法,其中监督学习算法有SVM、神经网络、逻辑回归、朴素贝叶斯、决策 树、Adaboost、GBDT、随机森林、KNN、时间序列等,非监督学习算法有K-Means、K-Medians、层次聚类等。
此外,Datahoop2.0还提供了大多数传统的统计分析算法,如(列举几个)等。在Datahoop2.0中,算法一方面以Python模块的形式呈现,同时,为了方便用户使用,Datahoop2.0还提供了图形用户界面(GUI),用户可以通过使用预先定义好的多种模块组成工作流,来完成复杂的数据挖掘工作。Datahoop2.0也将根据行业和客户需求持续更新。
4.可视化:
①多图表支持功能Datahoop2.0支持多种图表,常见的有表格、折线图、簇状柱形图、条形图、饼图等,酷炫的有漏斗图、词云、瀑布图、雷达图、双轴图、散点图、堆积柱/条形图、百分比堆积柱/条形图等,还有精美的地图、热力图、气泡图随您选。
②自由拖拽在Datahoop2.0的可视化分析台上,用户可以自由进行数据的拖拽,并对数据进行筛选、条数限制、数据公式、颜色设置等操作,最终生成可视化图表。数据筛选器帮助用户灵活选择和调 整图表生成条件,对展示的数据区间进行细分和深层分析。
5.产品特色
多数据源支持Datahoop2.0支持Excel、CSV、TXT等文本格式数据,也支持链接MySQL、SQLSever、Hive等常用大型数据库。用户只需上传数据或配置数据库,即可根据需要进行分析。便捷的拖拽效果、清晰的页面导航,让您分分钟完成数据分析,发掘数据价值
完善的预处理方法在数据分析的过程中,用户获取到的海量数据中必然会有脏数据,并不能直接用来分析。为了让用户不必在数据预处理上耗费过多精力,Datahoop2.0提供了完善的数据预处理方法。用户可根据需要进行选择,点击“确定”即可完成数据清洗、数据集成、数据变换、数据规约以及数据探索等数据预处理过程。
海量可视化图表Datahoop2.0拥有海量可视化图表,不管是普通的柱形图、饼状图、条形图、折线图还是酷炫的词云图、气泡图、雷达图、漏斗图等,只需拖拽数据,选取所需的图表,即可完成。Datahoop2.0还支持数据筛选、颜色设置等多种功能。
算法模型一次建模多次应用,业务人员也能进行数据分析,深度挖掘数据价值。Datahoop2.0同时提供WebIDE,为会敲算法的您提供了线上编辑算法、保存并形成自己的专属模块的功能,一次编辑完成,再次使用时直接拖拽调用。
共享中心
数据价值很大?代码非常完美?经验十分丰富?来Datahoop2.0共享中心,分享您的数据、代码和经验,为苦于寻找、努力钻研的小伙伴提供帮助,同经验丰富、分析大咖们切磋交流。数据查找困难?代码总是报错?分析经验不足?来Datahoop2.0共享中心,找你所想,查你所盼,总有那么一条分享满足你的需求。
项目中心找项目?上Datahoop2.0项目中心,针对不同领域或行业
的各种项目,接到你手软!工作量大?上Datahoop2.0项目中心,不愁没有解决方
案,同时帮你认识更多大牛!自建算法:
资深数据分析师的您,把您的算法作品分享到平台,让平台给您整合为价值无限的软资产,也让您像玩乐高玩具一样把您的算法用起来!
集大数据分析处理平台和社交平台于一体的Datahoop2.0,是一款真正意义上属于每个人的分析工具。其功能之强大,数据体量及类别之多、算法模型涵盖之广,无与伦比!