当前位置 > 首页 > 99%数据分析师关心的问题 > 盘点2万名数据分析师常用的数据分析方法有哪些?

盘点2万名数据分析师常用的数据分析方法有哪些?

来源:数据分析师 CPDA | 时间:2017-01-03 | 作者:admin

很多做数据分析或者刚接触数据分析的小伙伴,不知道怎么做数据分析?一点思维都没有,今天小编给大家盘点2万名数据分析师常用的数据分析方法有哪些?希望看完此文的小伙伴,有一个清晰的数据分析思维。

 

数据分析思维混乱的小伙伴,需要宏观的方法论和微观的方法来指导。

 

方法论和方法有什么区别?

 

方法论是从宏观角度出发,从管理和业务的角度提出的分析框架,指导我们接下来具体分析的方向。方法是微观的概念,是指我们在具体分析过程中使用的方法。

 

数据分析方法论

数据分析的方法论很多,这里我给大家介绍一些常见的框架。

 

①PEST分析法:PEST 为一种企业所处宏观环境分析模型,从政治(Politics)、经济(Economy)、社会(Society)、技术(Technology)四个方面分析内外环境,适用于宏观分析。四点因素也被称之为“pest有害物”,PEST要求高级管理层具备相关的能力及素养。PEST分析与外部总体环境的因素互相结合就可归纳出SWOT分析中的机会与威胁。PEST/PESTLE、SWOT 与 SLEPT 可以作为企业与环境分析的基础工具。

 

②SWOT分析法:从优势(Strength)、劣势(Weakness)、机遇(Opportunity)、威胁(Threat)四个方面分析内外环境,适用于宏观分析。SWOT分析法是用来确定企业自身的竞争优势、竞争劣势、机会和威胁,从而将公司的战略与公司内部资源、外部环境有机地结合起来的一种科学的分析方法。运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而根据研究结果制定相应的发展战略、计划以及对策等。

 

③5W2H分析法:从Why、When、Where、What、Who、How、How much 7个常见的维度分析问题。广泛用于企业管理和技术活动,对于决策和执行性的活动措施也非常有帮助,也有助于弥补考虑问题的疏漏。

 

④4P理论:经典营销理论,认为产品(Product)、价格(Price)、渠道(Place)和促销(Promote)是影响市场的重要因素。

 

⑤AARRR:增长黑客的海盗法则,精益创业的重要框架,从获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和推荐(Referral)5个环节增长增长。AARRR在应用推广运营各个层次(各个阶段)需要关注的一些指标。在整个AARRR模型中,这些量化指标都具有很重要的地位,而且很多指标的影响力是跨多个层次的。及时准确地获取这些指标的具体数据,对于应用的成功运营是必不可少的。

 

数据分析的方法论很多,这里不能一一列举;没有最好的方法论,只有最合适的。

 

从数据分析方法论也可得知,数据分析的意义在于将杂乱无章的数据转化为清晰可见的可视图,从而进行精准决策。“大数据时代,技术和分析哪个更重要”一文中也阐述了分析的重要性。

 

数据分析的七个方法

 

  1. 趋势分析

趋势分析是最简单、最基础,也是最常见的数据监测与数据分析方法。通常我们在数据分析产品中建立一张数据指标的线图或者柱状图,然后持续观察,重点关注异常值。

 

在这个过程中,我们要选定第一关键指标(OMTM,One Metric That Metter),而不要被虚荣指标(Vanity Metrics )所迷惑。

 

以社交类APP为例,如果我们将下载量作为第一关键指标,可能就会走偏;因为用户下载APP并不代表他使用了你的产品。在这种情况下,建议将DAU(Daily Active Users,日活跃用户)作为第一关键指标,而且是启动并且执行了某个操作的用户才能算上去;这样的指标才有实际意义,运营人员要核心关注这类指标。

 

  1. 多维分解

多维分解是指从业务需求出发,将指标从多个维度进行拆分;这里的维度包括但不限于浏览器、访问来源、操作系统、广告内容等等。

 

为什么需要进行多维拆解?有时候一个非常笼统或者最终的指标你是看不出什么问题来的,但是进行拆分之后,很多细节问题就会浮现出来。

 

举个例子,某网站的跳出率是0.47、平均访问深度是4.39、平均访问时长是0.55分钟。如果你要提升用户的参与度,显然这样的数据会让你无从下手;但是你对这些指标进行拆解之后就会发现很多思路。

 

下面展示的是一个产品在不同操作系统下的用户参与度指标数据。

 

用户参与度指标

 

仔细观察的话,你会发现移动端平台(Android、Windows Phone、IOS)的用户参与度极差,表现在跳出率极高、访问深度和平均访问时长很低。这样的话你就会发现问题,是不是我们的产品在移动端上没有做优化导致用户体验不好?在这样一个移动互联网时代,这是非常重要的一个问题。

 

  1. 用户分群

用户分群主要有两种分法:维度和行为组合。第一种根据用户的维度进行分群,比如从地区维度分,有北京、上海、广州、杭州等地的用户;从用户登录平台进行分群,有PC端、平板端和手机移动端用户。第二种根据用户行为组合进行分群,比如说每周在社区签到3次的用户与每周在社区签到少于3次的用户的区别,这个具体的我会在后面的留存分析中介绍。

 

  1. 用户细查

正如前面所说的,用户行为数据也是数据的一种,观察用户在你产品内的行为路径是一种非常直观的分析方法。在用户分群的基础上,一般抽取3-5个用户进行细查,即可覆盖分群用户大部分行为规律。

 

我们以一个产品的注册流程为例:

 

产品注册流程

 

用户经历了如下的操作流程:【访问官网】-【点击注册】-【输入号码】-【获取验证码】。本来是非常流畅的一个环节,但是却发现一个用户连续点击了3次【获取验证码】然后放弃提交。这就奇怪了,用户为什么会多次点击验证码呢?

 

这个时候我建议您去亲自体验一下您的产品,走一遍注册流程。你会发现,点击【获取验证码】后,经常迟迟收不到验证码;然后你又会不断点击【获取验证码】,所以就出现了上面的情况。

 

绝大多数产品都或多或少存在一些反人类的设计或者BUG,通过用户细查可以很好地发现产品中存在的问题并且及时解决。

 

  1. 漏斗分析

漏斗是用于衡量转化效率的工具,因为从开始到结束的模型类似一个漏斗,因而得名。漏斗分析要注意的两个要点:

 

第一,不但要看总体的转化率,还要关注转化过程每一步的转化率;

 

第二,漏斗分析也需要进行多维度拆解,拆解之后可能会发现不同维度下的转化率也有很大差异。

 

某企业的注册流程采用邮箱方式,注册转化率一直很低,才27%;通过漏斗分析发现,主要流失在【提交验证码】的环节。

 

流失环节

 

经过了解发现,邮箱验证非常容易出现注册邮箱收不到邮件的情况,原因包括邮件代理商被屏蔽、邮件含有敏感字被归入垃圾邮箱、邮件送达时间过长等等。既然这么多不可控因素影响注册转化率,那就换一种验证方式。换成短信验证后,总体转化率提升到了43%,这是非常大的一个增长。

 

  1. 留存分析

留存,顾名思义就是新用户留下来持续使用产品的含义。 衡量留存的常见指标有:次日留存率、7日留存率、30日留存率等等。我们可以从两个方面去分析留存,一个是新用户的留存率,另一个是产品功能的留存。

 

留存分析

 

第一个案例:以社区网站为例,“每周签到3次”的用户留存率明显高于“每周签到少于3次”的用户。签到这一功能在无形中提升了社区的用户的粘性和留存率,这也是很多社群或者社区主推这个功能的原因。

 

第二个案例:首次注册微博,微博会向你推荐关注10个大V;首次注册LinkedIn,LinkedIn会向你推荐5个同事;申请信用卡时,发卡方会说信用卡消费满4笔即可抽取【无人机】大奖;很多社交产品规定,每周签到5次,用户可以获得双重积分或者虚拟货币。

 

在这里面“关注10个大V”、“关注5个同事”、“消费4笔”、“签到5次”就是我想说的Magic Number,这些数字都是通过长期的数据分析或者机器学习的方式发现的。实践证明,符合这些特征的用户留存度是最高的;运营人员需要不断去push,激励用户达到这个标准,从而提升留存率。

 

  1. A/B测试与A/A测试

A/B测试是为了达到一个目标,采取了两套方案,一组用户采用A方案,一组用户采用B方案。通过实验观察两组方案的数据效果,判断两组方案的好坏。在A/B测试方面,谷歌是不遗余力地尝试;对于搜索结果的显示,谷歌会制定多种不同的方案(包括文案标题,字体大小,颜色等等),不断来优化搜索结果中广告的点击率。

 

这里需要注意的一点,A/B测试之前最好有A/A测试或者类似准备。什么是A/A测试?A/A测试是评估两个实验组是否是处于相同的水平,这样A/B测试才有意义。其实这和学校里面的控制变量法、实验组与对照组、双盲试验本质一样的。

 

三、流程——宏观、中观和微观

① 宏观

 

1.中国古代朴素的分析哲学

 

其实数据分析自古有之,中国古代很多名人从事的其实就是数据分析的工作;他们的名称可能不是数据分析师,更多的是“丞相”、“军师”、“谋士”,如张良、管仲、萧何、孙斌、鬼谷子、诸葛亮。

 

他们通过 “历史统计”-“经验总结”-“预测未来” 为自己的组织创造了极大的价值,这是中国古代朴素的分析哲学的重要内容。

 

2.精益创业的MVP理念

 

风靡硅谷的精益创业,它推崇MVP(最简化可行产品)的理念,通过小步快跑的方式来不断优化产品、增长用户。

 

MVP理念

 

在运营工作中,我们要大胆尝试,将想法转化成产品和运营方法。然后分析其中的数据,衡量产品或者运营的效果。如果好的话保持并大力推广,如果不好的话总结问题及时改进。在“构建-“衡量”-“学习”的不断循环中逐渐优化,这个流程是非常适合运营工作的。

 

② 中观

 

例如,具体的分析流程:1.明确分析目的和思路 →2.数据收集 →3.数据处理 →4.数据分析 →5.数据展现 →6.报告撰写。这个流程只是从“数据”的角度阐述了前后的流程,并未结合业务实际;而且它将数据分析的落脚点定位于“报告撰写”是具有误导性的,因为数据分析的最终目的是为了指导实践,而不是写一份报告。

 

但是这个流程仍具有参考价值,尤其是 “明确分析目的和思路” 对于新手入门具有一定的指导意义。

 

③ 微观

下面介绍的是一个非常详细的分析流程,借助于一定的分析工具,我们可以按照这个思路对您的网站/APP进行细致入微的分析。它的前提是用数据分析工具做好数据采集和监控工作,把精力集中在业务分析上。

 

分析流程

 

这个流程的核心是“MVP”的理念,“发现问题”-“设计实验”-“分析结果”,通过数据来不断优化产品和运营。

 

四、应用——统计和分析

 

案例1:搭建数据分析体系

 

小张今年刚毕业,在某公司从事新媒体工作,负责微信的日常运营。小张并不清楚微信运营的核心目的,尝试了很多方法,原创、翻译、改写了很多文章发布在微信上,但是阅读量时高时低,总体一般。

 

经理让小张想办法改进一下微信运营,提高微信的粉丝数和阅读数;但是张三毫无头绪,无从下手。这是很多运营真实的写照,琐碎的工作容易让人忘记思考,这很可能就发生在你我的身边。

 

我们从数据分析的角度对这个案例进行了诊断,总结了小张存在的这些问题:

不清楚自己需要关注哪些核心指标;
不清楚目标用户的特征(用户属性、用户画像等);
对自己过往工作缺乏系统分析(数据采集、监测和分析)。

 

从业务增长的角度出发,我给小张量身定做了一套数据分析体系,配合其内容工作的开展。

 

第一点,内容定位。

 

运营需要明确知道自己的目标或者KPI,然后选择一个核心关键指标(OMTM)进行监测。如果是创业公司,初期可能需要拉新,那么核心指标是注册用户数或者新访问用户数。如果是资讯媒体,注重影响力和覆盖面,那么核心指标应该是微信阅读数或者网页PV。

 

第二点,用户画像。

 

无论是哪一种运营岗位,都需要明确知道自己的(目标)用户是那些人?这些人都有哪些特征,他们的关注点和痛点是什么?如果你的用户是产品经理,那么可以尝试爬虫抓取产品经理网站上有关的问题,然后做文本分析:这是定量层面的分析。

 

同时,通过调查访问和问卷调研,获取更加深入的用户特征信息:这是从定性层面的分析。

 

第三点,持续监测。

 

借助数据分析工具,对核心关键指标(OMTM)进行持续监测。对于指标异常情况,我们需要及时分析和改进。

 

第四点,数据分析。

 

统计和分析过往内容的数据,找出哪些内容、哪些标题、哪些形式、哪些渠道的效果更好,然后朝这方面不断优化。

 

案例2:分析业务核心指标

 

电子邮件营销是现在很多企业仍在采用的营销和运营方式,某互联网金融企业通过EDM给新用户(有邮件地址但是未注册用户)发送激活邮件,一直以来注册转化率维持在20%-30%之间,8月18日注册转化率暴跌,之后一直维持在10%左右。这是一个非常严重的衰退,需要立即排查原因。

 

EDM渠道注册转化率涉及到太多的因素,需要一个一个排查,数据分析师帮运营罗列了可能的原因:

 

技术原因:ETL(数据抽取、转化、载入)出现问题,导致后端数据没有及时呈现在BI报表中;
宏观原因:季节性因素(节假日等),其余邮件冲击(其余部门也给用户发邮件稀释了用户的注意力);
微观原因:邮件的标题、文案、排版设计,CTA设计,注册流程设计。

 

一个简单的业务指标,会影响到它的因素可能是多种多样的,所以我们需要对可能涉及到的因素进行精细化衡量才能不断优化。最后发现,产品经理在注册环节添加了『绑定信用卡』,导致注册转化率大幅度下降。

 

五、学习——业务、工具和资源

 

业务层面

 

数据分析并没有想象中的高不可及,掌握好相应的概念、思路、流程,运营都可以做好数据分析。这里要着重强调一点,数据分析的目的是指导业务实践;脱离实践的数据分析、为分析而分析的数据分析都是在耍流氓。

 

不同于职业的数据分析师和数据科学家,运营人员做好数据分析的前提是娴熟的业务理解。从业务的角度来说,数据不是数字,它是用户的心声。运营人员要从数据中发现问题,不断优化,提升用户体验、为用户创造更多的价值。

 

工具层面

 

磨刀不误砍柴工,做好数据分析工具必不可少。我汇总了下面几种工具,运营可以结合自己的实际需要采用。

 

Excel 是最常见、最基础的数据分析工具,Excel 里面的图表、函数、透视表能满足大家基本的需求。Access 是微软 office 系列套装的一部分,是一种小型的关系数据库;当excel数据量很大、表格之间各种关联、查询、更新频繁的时候,Access就是一种非常不错的选择。

 

Python是一种高级的编程语言,近年来发展很快,它可以用来做数据分析、编程或爬虫;R语言是一种数据分析工具,在统计学中广泛使用。目前,Python被广泛用来编写爬虫程序,获取网上的信息,这是对运营人员非常有帮助的。

 

Google Analytics、百度统计是常见的网站流量分析工具

 

Mixpanel、Heap 、Datatist 属于用户行为数据分析工具,较前者功能更加丰富、分析更细致。

 

资源层面

 

运营入门数据分析,并不需要学习多么复杂的数学知识理论,更多的是将业务操作和数据分析结合起来。CPDA数据分析师课程设计初衷便是透过数据,决策企业战略,是数据分析“高段位”课程,CPDA数据分析课程也是多年数据分析项目经验老师的精华结晶。