400 050 6600
数据分析师

手机号

验证码

30天自动登录

误用数据可视化图表的后果

来源: / 作者: / 时间:2022-11-02

2011年的年终总结会议上,管理者们需要对2009-2011年公司营收趋势做分析,以制定2012年公司的经营战略。公司的数据分析师小Z针对公司近三年的营收情况做了图表,如下图:




管理者们看到此图后,提出了疑问:在年终汇报中,未提2011年的营收大幅度缩水,但为何图表呈现的信息如此?请问大家:您认为是哪里出了问题呢?


问题:这一讲我们一起来聊一聊可视化图表的误用问题。其实,类似的可视化误用问题非常多见,也就是说,可视化图表传达的意思并不是数据的真实含义,不恰当的使用图表可能展示出完全不同的结果。有些情况的误用是数据分析师不经意的行为所导致的。但是,仍旧有大量的误用是人为故意导致的。那么,如何避免自己出错,同时避免被他人误导呢?我们需要对这类图表做一些归纳总结。


分析:这里我们给大家概括以下几种常见的图表错误类型:

第一:坐标轴(尤其是纵坐标)起点不为零。这也是我们开篇的案例所呈现出的问题。如果我们想让数据呈现较大的波动性,或者做对比时大小关系较显著,建议将零点截掉,之后适当改变纵坐标的数据间隔即可。按照上述方法处理后,开篇案例数据的图表呈现结果如下:

此时,图表呈现该公司的3年营收则与实际营收相符。


第二:坐标轴无刻度,或刻度不均匀。让我们看下面两幅图,这是美国的医疗服务成本的变化情况,请问两幅图的差距在哪里?相信大家也发现了其中的秘密,有人想表达医疗服务成本稳步提升的结论,但是慧眼的观众却发现了端倪,并不是稳步提升,而是1970以后大幅提升。



第三:奇怪的双轴图。我们再看下述两幅图,基于同一组数据,我们可以从中得出什么结论呢?家庭收入增长超过了消费者物价指数,人们变富了?还是家庭增长收入低于消费者物价指数,人们变穷了?




其实,家庭收入和消费物价指数的量纲不同,并没有可比性,这种对比毫无意义。因为坐标轴的刻度可以随意设置,还可以把零点截掉,因此这两个轴可以被无限发挥,甚至基于同一数据做出无数幅图出来。


第四:横纵坐标互换。看左边一幅图,请问票价随着时间变化是增加了还是稳定不变呢?请大家再看右图,是不是完全不同的视觉体验呢?



建议:为避免可视化图表的误用对我们的误导,我们需要做到以下几点:第一:谨慎对待由不含零点、没有刻度或刻度不均匀的坐标轴所构成的图形。第二:谨慎对待含有两个纵轴的图形,尤其是当两个纵轴没有可比性时。第三:在误用图表的世界里,任何手段都可以综合使用,我们在绘制图表时需从业务角度出发,综合考虑,选择合适的可视化图表。最后:数据本质上并不会说谎,但是随意滥用图表则可能会混淆视听。数据分析师需要做到的是面对数据时要足够客观,任何可视化的过程都要遵守规则,同时看到图表时要综合业务部们需求,准确解读图表的含义并输出正确结论。
Prev article

AI在客服中心系统的应用

Next article

为什么推理结果与直觉大相径庭?

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务