当前位置 > CPDA数据分析师 > “数”业专攻 > 什么是数据采集?数据采集的程序是怎样的?

什么是数据采集?数据采集的程序是怎样的?

来源:数据分析师 CPDA | 时间:2016-11-21 | 作者:admin

数据采集包括历史数据的采集和当前市场数据的采集,是科学进行数据分析的基础。数据采集的准确与否直接决定了数据分析的价值。

 

在企业运营过程中,假设企业环境基本稳定,项目发展的规律在运营期内没有大的变化,我们可以通过搜集准确的历史数据或可比历史数据,根据以往的发展规律,运用定量预测技术对未来收入和成本加以预测,直接推算出预测的相关数据。当运营环境略有改变时,可以利用定性预测技术对预测结果加以修正。因而,这类项目的数据采集主要是针对历史数据的有效采集。

 

数据采集程序

 

1.制定市场研究的具体计划

在市场研究工作中数据采集是最重要的部分,它帮助解决投资与经营中相关的重要数据的确定和决策的改进。然而,数据采集工作是需要花费大量资金的,经管其带来的益处不言而喻,但是,如果要采集数据,就一定要让这笔花费资金超所值。为了达到这一目标,需要周密的计划、安排和监控。

 

2.明确数据来源

在数据采集前,必须要对数据资料进行选择。数据资料按其来源不同,可分为第一手资料和第二手资源。第一手资源指为了一定的目的采集所得的原始材料。采集第一手资料的费用较高,但资料常常来自现场的调查,其准确度高且针对性强。第二手资料是指采集的现成资料。包括互联网信息,各种报刊文献上的资料,还有各类权威机构发布的统计和研究报告等。在现代项目研究中心,由于互联网的普及,获得二手资料信息比起以往变得更加便捷,内容也异常丰富,所以二手资料的采集成为非常重要的调研手段,他有便捷、成本低的优点。数据分析人员还可以从内部资料中提取第二手资料,也可以利用外部资料间接获取。常见的内部资料获取往往来自于企业的财务报表。比如,资金平衡表、销售统计以及其他报表档案。

 

3.明确抽样方案及样本容量

在一手数据的采集中,根据项目所属的特定行业及特定市场定位,许多数据可以通过直接采集得到全部样本,尤其对于成本、费用等可控制的要素;然而,对于其他数据的采集,比如说产量机器趋势变化数据,其总体范围很广,很难直接获取全部数据。这时,我们常用抽样技术,从拟采数据的总体中抽取具有代表性的部分单位作为样本,对样本进行调查或观察,并根据样本统计量估计总体参数,对其投资数据进行预测。

 

4.明确数据采集方法

数据采集方法往往采用三种方法:访问调查法、实验法和观察法。访问调查法通过访问代表性样本而获得数据,强调语言应答,而观察法强调非语言方式,通过调查人员在事件发生时或在过去已发生的记录中采集信息。与上述两种方法相比,实验法能够有效控制调研环境。在实际项目数据采集中,可根据项目特点、数据采集成本费用预算标准时间及精度要求,采用不同的方法。

 

5.问卷设计

为了达到采集数据的目的,采用问卷形式进行调查是近年应用最广的一种调查手段。问卷设计的好坏,很大程度上取决于调查问卷的回收率和有效率。另外,一张好的问卷必须满足后期数据分析的两个基本标准:相关性和准确性。

问卷设计部分包括对文君结构、问卷设计原则、问卷的问题格式等问题的讨论与分析。

 

6.数据处理及分析

原始数据收集回来以后,可能出现虚假、差错、冗余等现象,如果简单地把这些数据投入预测分析,可能会带来错误的分析结论,从而使整个分析工作失去意义。因此,首先要对数据进行整理加工,才能进行分析研究并得出科学的结论。数据的处理是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、编码、录入及预分析的过程。