当前位置 > CPDA数据分析师 > “数”业专攻 > 大数据和数据分析领域除了4V,还应该有更重要的第五个V

大数据和数据分析领域除了4V,还应该有更重要的第五个V

来源:数据分析师 CPDA | 时间:2019-01-27 | 作者:admin

500517950 - 大数据和数据分析领域除了4V,还应该有更重要的第五个V

 

“大数据”从之前的难以理解,到渐渐地融入到了我们的生活当中,如今数据无时无刻,随时随地被挖掘同时也在被使用。对于不同的人大数据意味着许多不同的东西,如果是从技术的角度观察大数据,而不是商业角度或行业角度,大数据的理解是有所不同的。

 

从本质上讲,大数据(并不是很好的描述)可以描述成两个主要现象:

 

我们现在正以惊人的速度生成新数据

我们提高了存储,处理和分析数据的能力

 

500518396 - 大数据和数据分析领域除了4V,还应该有更重要的第五个V

 

我们一直使用4个V来描述大数据:体积、速度、多样性和准确性。值得一提的是,这些数据和我们使用这些数据的能力也在增强,下一步将其转化为Value,这是本文所说的第5个大数据V

 

接下来我们先了解下4V:

 

体积指的是每秒产生的大量数据。想象一下我们每秒生成和分享的文件、照片、视频等等的数据量。现在谈论不在是TB,而是zettabytes甚至是brontobytes数据量。如果我们从世界开始时到2000年时的所有数据加起来,和我们现在每分钟产生的数据是一样的!这使得数据集越来越大,无法使用传统的数据库技术存储和分析。在借助了大数据技术后,我们现在可以在分布式系统的帮助下存储和使用这些数据集,且可以把部分数据存储在不同的位置上,通过网络连接,或通过软件连接在一起。

 

速度是指生成新数据的速度和数据移动的速度。试想一下,社交媒体消息在几分钟内迅速传播,检查信用卡交易是否存在欺诈行为的速度,或者交易系统分析社交媒体网络接收到触发买卖股票决定的信号所需的毫秒。现在大数据技术还可以做到我们在生成数据时实时进行分析数据,而无需将其放入数据库中。

 

多样性指的是我们现在可以使用的不同类型的数据。在过去,大部分关注于结构化数据,这些数据非常适合表格或关系数据库,比如财务数据(例如,按产品或地区划分的销售额)。事实上,现在80%的数据是非结构化的,因此不能很容易做到放入表格或关系数据库中。如今社交媒体更新上的照片、视频、媒体等通过大数据技术,利用不同类型的数据,包括消息、社交媒体对话、照片、传感器数据、视频或语音记录等等,并将它们与更传统的结构化数据结合在一起。

 

准确性是指数据的混乱或可靠性。在许多形式的大数据中,质量和准确性是不太可控的,例如带有标签、缩写、拼写错误和口语的文章。现在大数据和分析技术就可以帮助我们处理这些类型的数据,弥补数量质量或准确性的不足。

 

500521317 1 - 大数据和数据分析领域除了4V,还应该有更重要的第五个V

 

但所有快速移动的、不同种类和准确性的数据量都必须转化为价值!这就是为什么价值在大数据中呈现非常重要的原因。

 

价值是指我们将数据转化为价值的能力。重要的是,企业要为任何收集和利用大数据的尝试提供理由,如果不清楚大数据将带来的商业价值,就很容易掉进坑中,所以开始大数据计划是现在商业中重要的组成部分。

 

大数据允许公司优化他们的流程:优步能够预测需求,动态定价旅程并将最近的驱动程序发送给客户。

 

大数据改善了我们的卫生保健:政府机构现在可以预测流感暴发并实时跟踪它们,制药公司可以使用大数据分析来快速跟踪药物开发及生产。

 

大数据有助于我们提高安全性:政府和执法机构利用大数据来遏制犯罪并及时发现网络犯罪。

 

大数据允许体育明星提升他们的表现:球中的传感器,球场上的摄像头和衣服上的GPS跟踪器允许运动员分析和改进他们的工作。

 

………………

 

500522894 - 大数据和数据分析领域除了4V,还应该有更重要的第五个V

 

 

大数据的第五大V:价值,这是一个起点,利用好帮助企业发展、受益,实现收益。

 

大数据的应用是无止境的,现在我们拥有了如此之多的数据和分析数据的能力,商业和社会的方方面面将很快发生变化。