当前位置 > CPDA数据分析师 > “数”业专攻 > EXCEL中的数据分析—抽样分析

EXCEL中的数据分析—抽样分析

来源:数据分析师 CPDA | 时间:2019-05-23 | 作者:admin

今天给大家分享的是如何用EXCEL来做抽样分析。 

有的时候我们的在使用数据的时候不需要直接使用全量的样本来进行分析,而是没有针对性的取出样本量中部分数据进行分析,如果针对性的取数又会对分析结果产生影响。所以今天咱们大家一起来看一下如何使用EXCEL来进行抽样。

 

首先我们来看一下我们的数据:

 

微信图片 20190523140633 - EXCEL中的数据分析—抽样分析
上图中就是本次需要进行处理的数据:企业中有一百个员工(未全部将数据截图),在参加技能培训以后需要随机抽出25名员工进行检验,以便于企业了解本次培训效果并为后期培训提供参考。

 

因为每个人的培训效果都是不一样的,在这里我们假设每个员工都是认真对待了此次培训,但是需要了解培训效果从而优化企业的培训方式。我们在随机进行抽取25名员工的时候,不能直接选前25个员工或者后面25个员工。因为一般来说,员工编号代表了员工入职的顺序,也就是说员工编号小的人比员工编号大的人先进入到公司,对企业的了解程度也是不一样的,所以我们需要进行随机抽样。

 

微信图片 20190523140637 - EXCEL中的数据分析—抽样分析 微信图片 20190523140641 - EXCEL中的数据分析—抽样分析
我们依旧选择数据栏中的分析模块,点击数据分析(关于数据分析模块添加方法之前文章中有详细讲解,就不过多赘述),选择抽样以后就会出现上面这个窗口。我们将我们的数据放到输入区域中,在选择抽样方法的时候我们选择随机抽样,同时输入我们需要的样本量。在抽样方法处还有一个方法是间隔抽样,也就是我们按照一定的间隔周期进行抽样,输入区域中位于间隔点的数据以及此后每一个间隔点的数据都会被选中,一直到整个输入区域的末尾,抽样停止,不过在本题中我们选择随机抽样的方法,这个方法不受间隔周期的限制,直接设置完样本量以后由电脑自行进行抽样。最后我们选择输出的位置,点击确定就会出来我们需要的抽样结果 :

 

微信图片 20190523140646 - EXCEL中的数据分析—抽样分析
在出来结果的时候我们还需要注意一点,就是我们输出区域由电脑随机抽取出来的数据不是唯一的,也就是说任何数据都是可以被多次抽取的,所以我们随机抽样所得到的的数据量实际上可能是会小于我们需要的数据量的(文后会给大家介绍如何处理这种情况)。比如在上面这个输出图中,1171、1189、1188等几个数就被重复抽取了。我们需要25个样本量,按这个结果来的话是肯定不够的,所以一般来说我们在第一次选出来以后需要进行筛选,看最后我们的样本量还差多少,然后再进行补充,也就是重复一次抽样,或者在抽样的时候调大我们的样本量,也是可以一定程度上解决这个问题。

 

下面我们来看看针对上面的结果如何进行筛选,首选我们选中我们的样本数据列,在数据栏中选择筛选中的高级筛选:

 

微信图片 20190523140654 - EXCEL中的数据分析—抽样分析
在高级筛选界面中勾选选择不重复的记录,点击确定,我们就能得到如下结果:

 

微信图片 20190523140650 - EXCEL中的数据分析—抽样分析
这个时候我们会发现,到现在为止我们选择了23个样本,确实比我们所需的25个样本量要少。所以我们还需要再加入两个样本,具体步骤可以重复最开始的随机抽样就行,要注意把已经选出来的样本去掉,这样的话就全部完成了我们本次的抽样。

 

抽样主要是在我们平时处理数据的时候用到,能够在一定程度上保证我们最后分析结果的严谨性和准确性。大家可以自己尝试操作一下,这个方法是很容易就能上手的。

 

北京CPDA 57期学员:曾洲