当前位置 > CPDA数据分析师 > “数”业专攻 > 探究数据分析师被询问的问题

探究数据分析师被询问的问题

来源:数据分析师 CPDA | 时间:2019-01-15 | 作者:admin

500479879 1 1024x473 - 探究数据分析师被询问的问题

 

现如今数据分析师的需求量很大。随着这些分析师加入企业。当这些大量的分析师加入企业时,他们知道如何与管理者谈论那些至关重要数据及发现。对于数据分析师来说,让管理者充分理解数据分析的结果和概念同样重要。

 

500482213 1024x459 - 探究数据分析师被询问的问题

 

数据是如何收集的?假设分析师辛勤工作的结果是这样的:“看到广告的客户购买产品的可能性是没有看到广告的客户的两倍。由于广告成本低于预期利润,我们应该向更多的客户展示广告”。对许多经理人来说,这听起来可能是个好消息,他们可能倾向于迅速采取行动。但在此之前,需要了解分析人员是如何得出这个结论的。不进一步调查可能会导致代价高昂的错误

 

如果展示广告的顾客是随机选择的,那么这可能是一个随机对照试验,上面的结论可能是有效的。然而,如果这些目标客户不是随机选择的,那么结果就不太可能是有效的。例如,如果广告是展示给北京的客户,而不是天津的客户,那么就不清楚客户所在的城市是否是一个混淆因素(产品只是在北京更受欢迎,与广告支出无关吗?)如果是这样的话,那么在上海或杭州即使展示更多的广告也可能不会导致更多的销量。如:北方城市和南方城市产品的属性差异就很大。

 

随机选择顾客进行实验。实验使我们能够高度自信地推断因果关系,如果做得对,可执行的结论是不容置疑的。另一方面,如果顾客不是随机选择的(例如,他们是根据城市来选择的),那么这只是一种观察性研究。观察性研究更依赖于事后的总结统计比事前随机化更容易受到“相关性不是因果关系”这句格言的影响。在这些研究中,重复研究是否会得到相同的结论还不太清楚。

 

500483063 1024x510 - 探究数据分析师被询问的问题

 

当然,除了这种简单的二分法之外,大多数分析还有更多细微的差别。例如,抽样中的偏差可能更细微,将我们认为是实验的东西变成了观察性研究。目标客户的选择是否基于高收入?如果是这样的话,低收入的消费者可能会有不同的反应。即使他们是随机选择的,如果实验是在一段时间前进行的,在从较老的客户群体中进行选择时,就会有一个隐含的样本偏差,因此新客户可能不会有相同的反应。另一方面,实验变量的存在会使看起来像是观察性研究的研究更像是准实验,从而为商业目的强化结论。客户看到的广告是否基于客户ID号?如果这个数字是随机产生的,那么这可能不是一个观察性研究,而是一个偶然的实验。

 

观察性研究和实验都被称为“数据分析”——毕竟,两者都来自“看数据”。以不同的方式对待从这些不同类型的分析中得出结论的强度,并探究分析,以充分理解所执行分析的类型。这并不意味着应该忽略观察研究的结果,实验可能是昂贵且耗时的。相反,要了解观察性研究的具体弱点,并将这些发现作为与数据分析师进行更长的对话的起点,讨论他们分析的基本假设和潜在偏差。将任何数据分析的结果与其行业经验以及正在评估的每种备选方案的潜在风险和收益进行平衡。

 

500483095 1024x535 - 探究数据分析师被询问的问题

 

误差范围是多少?现在,让我们假设数据分析师得出结论,广告展现的客户购买产品的可能性比没有广告展现的客户高20%。根据样本的大小和分析是如何进行的,可能对这个结果有信心,也可能没有。衡量这种信心的一个指标是标准误差。在上面的例子中,如果标准误差是30%,那么很有可能(25.25%)广告对购买没有帮助,结果可能被认为是统计上的不显著。即使标准误差只有10%,也有很小的几率(2.28%)广告不会对销售产生正面影响。数据分析师总是通过误差线报告这种信心的一些衡量标准 这反映了标准错误和良好的数据管理者批判性地思考这种不确定性如何影响他们的业务。

 

在此之前,不需要(通常也不能要求)数据的绝对确定性。在上面的例子中,我们不仅关心广告增加购买的可能性,我们还关心这种可能性的可能性:客户购买的可能性增加30%的可能性有多大?他们增加10%购买的可能性有多大?潜在的上行与潜在的下行如何权衡?而精神乏味。这种可能性分析对于真正理解vou所做决策的风险是必要的。

 

500492442 1024x683 - 探究数据分析师被询问的问题

 

对于必须做出的商业决策,几乎不可能100%确定,但是统计数据可以帮助聪明的管理者量化并限制他们决策的风险。但是,永远不要从表面上看数据分析师的结论。在使用他们的结论为决策提供信息之前,询问他们使用的方法和误差范围。