当前位置 > CPDA数据分析师 > “数”业专攻 > 大数据的优点和优势,了解了吗?

大数据的优点和优势,了解了吗?

来源:数据分析师 CPDA | 时间:2019-09-12 | 作者:admin

what is big data article - 大数据的优点和优势,了解了吗?

 

大数据是什么意思?

正如Gartner所定义的那样——“大数据是高容量、高速度和/或高多样性的信息资产,需要新的处理形式来支持增强的决策、洞察发现和流程优化。“让我们更深入地挖掘,用更简单的术语来理解这一点。

 

“大数据”这个术语不言自明,它是一组普通计算技术无法处理的极端大数据集。这个术语不仅指数据,还指所涉及的各种框架、工具和技术。技术进步和新的沟通渠道(如社交网络)的出现,以及更强大的新设备,给行业参与者带来了挑战,因为他们必须找到其他方式来处理数据。

 

从一开始到2003年,整个世界只有50亿千兆字节的数据。同样的数据在2011年仅用了两天的时间。到2013年,这样的数据量每10分钟生成一次。因此,世界上90%的数据都是在过去几年里得到的,这并不奇怪。

 

所有这些数据在处理时都是有用的,但在大数据概念出现之前,这些数据一直被严重忽视。

 

专业提示:要了解更多关于大数据的知识,并涉足数据科学行业,可以考虑在大数据或相关技术(如Impala、Cassandra、Spark和Scala)方面进行专业认证培训。

 

大数据的主要来源

黑匣子数据:这是飞机生成的数据,包括喷气式飞机和直升机。黑匣子数据包括机组人员声音、麦克风录音和飞机性能信息。

 

社交媒体数据:由Twitter、Facebook、Instagram、Pinterest和谷歌+等社交媒体网站开发的数据。

 

股票交易所数据:这是来自股票交易所的关于客户买卖股票决策的数据。

 

电网数据:这是来自电网的数据。它包含特定节点上的信息,比如使用信息。

 

传输数据:这包括可能的容量、车辆模型、可用性和车辆所覆盖的距离。

 

搜索引擎数据:这是最大的大数据来源之一。搜索引擎拥有庞大的数据库来获取数据。

 

此外,大数据和分析专家伯纳德·马尔(Bernard Marr)提出了一份精彩的清单,列出了20个可以在网上免费获得的大数据源。他们中的一些人在这里得到了简要介绍。

 

data .gov -美国政府的所有数据都可以免费访问,从气候到犯罪等信息都可以访问。

 

与此类似的是英国政府的门户网站Data.gov.uk,它收集了自1950年以来英国所有书籍和出版物的元数据。

 

还有美国人口普查局——它涵盖了有价值的信息,如人口、地理和其他数据。与此相同的是欧盟开放数据门户,包括来自欧盟机构的人口普查数据。

 

还有一些更接近我们兴趣的东西——Facebook Graph,它提供了应用程序接口信息(Graph API),在收集了用户公开共享的所有数据的信息之后。

 

在医疗保健领域,分别有来自美国和英国的Healthdata.gov和NHS健康与社会保健信息中心(NHS Health and Social Care Information Centre)。

 

谷歌Trends、谷歌Finance、Amazon Web Services公共数据集都是类似的例子。

 

从这些例子中,我们可以清楚地看到,大数据不仅仅与体积有关。它还包括数据的广泛多样性和高速度。2001年,行业分析师道格•兰尼(Doug Laney)明确指出,大数据的3个v分别是速度、数量和多样性。

 

如今,数据流的速度是前所未有的,这使得及时处理数据变得困难。智能计量、传感器和RFID标签使得几乎实时处理数据洪流成为必要。大多数组织发现很难对数据做出快速反应。

 

就在几年前,拥有太多的数据只是一个存储问题。然而,随着存储容量的增加和存储成本的降低,像远程DBA支持这样的行业参与者现在正关注相关数据如何能够创造价值。

 

今天的数据比几年前更加多样化。数据大致分为结构化数据(关系数据)、半结构化数据(XML表形式的数据)和非结构化数据(PDF、Word和文本文件形式的媒体日志和数据)。许多公司不得不努力管理、管理和合并不同的数据类型。

 

准确性(数据的质量)、可变性(数据有时显示的不一致性)和复杂性(处理来自不同来源的大量数据时)是数据的其他重要特性。

 

大数据的优点

今天的消费者要求很高。他在社交媒体上与顾客交谈,并在购买前考虑不同的选择。顾客希望在购买产品后被当作个人对待并得到感谢。有了大数据,你将获得可操作的数据,你可以用这些数据与你的客户进行一对一的实时互动。大数据让你做到这一点的一个方法是,你可以实时查看抱怨客户的个人资料,并获得他/她抱怨的产品的信息。然后你就可以进行声誉管理了。

 

大数据允许你重新开发你正在销售的产品/服务。关于其他人如何看待你的产品的信息——例如通过非结构化的社交网站文本——有助于你的产品开发。

 

大数据允许你测试CAD(计算机辅助设计)图像的不同变化,以确定微小的变化如何影响你的过程或产品。这使得大数据在制造过程中变得弥足珍贵。

 

预测分析将使你领先于竞争对手。例如,通过扫描和分析社交媒体提要和报纸报道,大数据可以促进这一点。大数据还帮助你对客户、供应商和其他利益相关者进行健康测试,以帮助你降低违约等风险。

 

大数据有助于保障数据安全。大数据工具可以帮助你绘制公司的数据图景,这有助于分析内部威胁。例如,你将知道你的敏感信息是否受到保护。一个更具体的例子是,你将能够标记16位数字(可能是信用卡号码)的电子邮件或存储。

 

大数据让你的收入来源多样化。分析大数据可以为你提供趋势数据,这些数据可以帮助你找到一个全新的收入来源。

 

如果你的网站想要在拥挤的网络空间中竞争,那么它就需要是动态的。大数据分析可以帮助你个性化你的网站的外观/内容和感觉,以适应每一个访问者,例如,国籍和性别。这方面的一个例子是Amazon的IBCF(基于项目的协同过滤),它驱动了“你可能认识的人”和“经常一起购买”功能。

 

如果你在经营一家工厂,大数据是很重要的,因为你不需要根据这些技术已经使用了几个月或几年来替换它们。这是昂贵和不切实际的,因为不同的零件磨损率不同。大数据可以让你发现故障设备,并预测你应该何时更换它们。