当前位置 > CPDA数据分析师 > “数”业专攻 > 做数据分析不用二手数据?错,二手数据的价值同样重要

做数据分析不用二手数据?错,二手数据的价值同样重要

来源:数据分析师 CPDA | 时间:2018-09-06 | 作者:admin

许多分析师会自己收集数据,然后进行分析,但是有时候,你也可以使用别人收集的数据(即二手数据)。二手数据的使用为分析师省下了那些可能花费在重复收集相同数据之上的时间。二手数据的一般来源包括人口普查、调查、企业记录等相关信息。目前,世界上有大量的二手,而且这些数据正静待分析。

 

f2db7ef1bba0e9cb - 做数据分析不用二手数据?错,二手数据的价值同样重要

 

有时候,二手数据被用来创造非常重要的结果。例如,约翰尼斯 · 开 ( Johanne KePler )的天文学成果的取得就在一定程度上归功于二手数据的取得。虽然出生于深陷困境中的贫寒家庭,但开普勒却幸运地获得了非常精确的二手数据,这些数据是几卜年来前人小心积累的关于天体运动的数据凭借运气以及出众的数学大赋.开普勒解开了星球的奥秘。

 

2be3107061dd7d01 - 做数据分析不用二手数据?错,二手数据的价值同样重要

 

开普勒的数据主要是由第谷 · 布拉赫( Tych 。 Brahe )收集的,他是一位丹麦贵族,同时也是一位睿钾的天文学家,因为设计出了在望远镜发明之前最精确的天文观测设备,他实现了同时期最为精确的天文观测-在丹麦王室慷慨的支持下,第谷建立了一个叫作天堡( ur 耐 borg )的天文台,这个天文台是欧洲最好的大文台。第谷设计并制造了新的观测设备,对其进行校准并开始了 20 多年的严谨的夜间观测。

 

356ea22302ea7c62 - 做数据分析不用二手数据?错,二手数据的价值同样重要

 

1600 年,第谷邀请了一个天资聪颖但贫困的教师,即开普勒担任他的助手:开普勒和第谷的相处并不愉快,因为他们的身世背景和个性相去甚远。第谷担心在他的时代,这一聪明年轻的助手可能会成为最好的天文学家而让他黯然失色。

 

3fb571b8693feba7 - 做数据分析不用二手数据?错,二手数据的价值同样重要

 

第二年,即在 1601 年,第谷突然病逝。继而发生的是对第谷的遗产的争夺,开普勒意识到,如果他不快速行动,那么他可能永远都无法获取并使用第谷的大部分数据。于是,开普勒立即占有(用开普勒自己的话来说是‘ · 篡夺”)一了这些观测数据,并掌握 J ’这些数据的控制权二第谷下葬两天后,开普勒被任命为皇室数学家职位的继任者。此时,第谷的无可比拟的天文观测数据全部掌握在了开普勒手中二通过使川这些数据,开普勒最终发现行星的运行轨道是椭圆形的,并形成了他的三大定律。

 

256e2d0e091bf53e - 做数据分析不用二手数据?错,二手数据的价值同样重要

 

时有很多更加现代的使用二手数据的例子例如, Rccordod Future公司的例子就足其中之一 Recorded Future公司的二手数据的来源是大家都作常熟悉的互联网 Recorded Futured公司是由分析专家克里斯托弗,阿尔伯格( Christopher Ahlberg)创办的,公司对互联网进行分析以计算与分类实体和事件被提及的频率 Recorded Future公司尤其关注统计预测——未来的提及频率。它把自己的数据和分析结果出售给政府情报机构,政府情报机构对像“恐怖主义”或“战争”,这样的词的提及赖率有着明显的兴趣。

 

另外,以金融脤务公司为例,它们对象征投资 者和消费者情绪的词语满怀兴趣。