当前位置 > CPDA数据分析师 > “数”业专攻 > 常见的数据分析形式,新手推荐

常见的数据分析形式,新手推荐

来源:数据分析师 CPDA | 时间:2019-01-17 | 作者:admin

5146 - 常见的数据分析形式,新手推荐

 

当开始一个数据分析项目时,通常首先独立地分析每个变量,以描述所拥有的数据并评估其质量。下一步是研究变量之间存在的关系。这些关系可能会得出有关数据所代表的某些推论或结论。这些结论可能会导致数学模型预测当前数据集中没有的数据的结果。然而,在数据分析导致决策或操作步骤之前,没有数据分析是有效的。

 

描述性分析

 

数据分析最简单的形式是描述性分析。描述性分析列出并总结了数据集中每个变量的值。例如,如果调查对象对某个特定问题给出了从1到10的评分,那么描述性分析可能会显示调查对象的数量和百分比。平均评分和中位数,模式或最常见评级,以及某些评分,集中趋势如标准差。如标准差描述性分析帮助你熟悉一个数据集与数据和识别问题,例如未提供任何评级的受访者或显示响应为“99”的数据。

 

探索性分析

 

一旦了解了所拥有的数据,下一步就是开始寻找数据元素之间的关系。这称为探索性数据分析,通常关注变量之间的相关性。为例,一组数据显示,儿童蛀牙的数量和词汇量之间存在着极高的相关性。然而,这并不意味着如果你让你的孩子长蛀牙,词汇量也会增加。可能还有其他因素导致数据集中没有的结果,例如年龄。

 

4950 - 常见的数据分析形式,新手推荐

 

推理分析

 

为了制定消费者信心指数,世界大型企业联合会(Conference Board)不会询问每个消费者对经济的信心。它使用推理分析,根据较小样本人群的数据得出关于消费者的结论。理解推理分析中使用的抽样方法很重要,因为通过选择不同的样本,通常可以从相同的数据集中得出非常不同的结论。与许多推理分析一样,消费者信心指数从其数据集中随机选择一个样本,这样无论选择哪个样本,结果都大致相同。

 

5166 - 常见的数据分析形式,新手推荐

 

预测分析

 

预测分析在商业智能应用程序中非常流行。目标是使用数据来预测未知的结果,然后根据预测采取行动。例如,保险公司使用性别等数据、年龄、婚姻状况和信用评分来预测哪些客户最有可能发生事故。然后,他们提高属于高风险人群的客户的保险费率。分析人员通过对已知结果的数据集的一部分进行模型培训,然后将模型应用于未知结果的其余数据,从而开发预测模型。