当前位置 > CPDA数据分析师 > “数”业专攻 > 实用的数据分析方法

实用的数据分析方法

来源:数据分析师 CPDA | 时间:2019-09-17 | 作者:admin

要使各种结构化的、非结构化的、海量的数据实现标准化、信息化,能够提供业务绩效评估、业务决策支持等要求,我们首先需要进行数据分析。

 

同时,围绕业务问题,采用合适的分析方法,分析模型,以及分析工具,这是数据分析师的必备技能。这里整理出了一套针对不同数据分析对象所采用的三大类分析方法,每类里面包含各种小方法。

 

业务分析类

1.1 杜邦分析法

 

杜邦分析法目前主要用于财务领域,通过财务比率的关系来分析财务状况,其核心要点是将一个大的问题拆分为更小粒度的指标,以此了解问题出在了哪儿,从而对症下药。以电商行业为例,GMV(网站成交金额)是考核业绩最直观的指标,当 GMV 同比或环比出现下滑时候,需要找到影响 GMV 的因素并逐一拆解。

 

三大类实用的数据分析方法 1 - 实用的数据分析方法

 

GMV 下降如果是因下单用户减少所造成的,那么是访客数(流量)减少了,还是转化率下降了呢?如果是访客数减少了,那是因为自然流量减少了,还是因为营销流量不足?

 

如果是自然流量下降的话,可能需要在用户运营和产品运营端发力,如果是营销流量不足,那么可以通过营销活动或者站外引流的形式增加曝光量。

 

最后,如果是因为客单价不高,那么需要进行定价及促销的方案优化,比如识别具有 GMV 提升潜力的商品进行定价优化,评估当前促销的 ROI,针对选品、力度和促销形式进行优化。同时通过关联商品的推荐或商品套装促销的形式,激发用户购买多件商品,也可以有效提高客单价。

 

1.2 同比热力图分析法

同比热力图分析法是把各个业务线的同比数据放到一起进行比较,这样可以更直观的观察了解业务的状况。构建一张同比热力图大致需要三步:

 

把核心问题进行分解;

计算每个业务各项指标的同比数据;

针对每一项指标,对比各业务的同比高低并设定颜色渐变的条件格式。

 

三大类实用的数据分析方法1 1 - 实用的数据分析方法

 

通过同比热力图的分析,首先,可以通过纵向对比了解业务自身的同比趋势,其次,可以通过横向对比了解自身在同类业务中的位置,此外,还可以综合分析 GMV 等核心指标变动的原因。

 

1.3 类BCG矩阵

BCG 矩阵: 又称市场增长率-相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。

 

波士顿矩阵由美国著名的管理学家、波士顿咨询公司创始人布鲁斯·亨德森于 1970 年首创。

 

基本原理:本法将企业所有产品从销售增长率和市场占有率角度进行再组合。在坐标图上,以纵轴表示企业销售增长率,横轴表示市场占有率, 将坐标图划分为四个象限,依次为“明星类产品(★)”、“问题类产品(?)”、金牛类产品(¥)”、“瘦狗类产品(×)”。其目的在于通过产品所处不同象限的划分,使企业采取不同决策,以保证其不断地淘汰无发展前景的产品,保持“问号”、“明星”、“金牛”产品的合理组合,实现产品及资源分配结构的良性循环。

 

这里想讲的并非传统的 BCG 矩阵,而是 BCG 矩阵的变阵,或者叫类 BCG 矩阵。根据不同的业务场景和业务需求,我们可以将任意两个指标作为坐标轴,从而把各类业务或者用户划分为不同的类型。

 

三大类实用的数据分析方法2 1 - 实用的数据分析方法

 

除此之外,我们还可以根据以下场景构建类 BCG 矩阵:

分析商品引流能力和转化率:流量份额-转化率

分析商品对毛利/GMV的贡献:毛利率-销售额

基于RFM分析用户的价值:访问频率-消费金额

 

三大类实用的数据分析方法3 1 - 实用的数据分析方法

 

用户分析类

2.1 TGI指数

TGI 指数又称目标群体指数,可反映目标群体在特定研究范围内的强势或弱势。

 

TGI 指数=用户分类中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例*100

 

TGI 指数表征不同特征用户关注问题的差异情况,其中 TGI 指数等于 100 表示平均水平,高于 100,代表该类用户对某类问题的关注程度高于整体水平。

 

如上图所示,各类目标用户在 16-25 岁这个年龄段的占比都比总体小(TGI指数<100),其中分类 1 的用户年龄偏大,因为该类用户在 36 岁以上各个年龄段的 TGI 指数都明显高于 100,且同时高于其他三类用户。

 

所以,在分析用户画像时,需要根据场景进行用户分类,并对比各类用户与总体间的差异,这样才能保证分析结果的可信性和适用性,而 TGI 指数就是很好的对比指标。

 

当前在互联网领域,除了用户实名数据以外,其他用户的画像维度一般都通过建立模型进行判断,因此无法完全保证准确性,但不同于小样本调研,大数据分析是能容忍一定数据误差的,不过,这一切都要建立在对比的基础上。

 

2.2 LRFMC模型

RFM 模型是客户关系管理中最常用的模型,但这一模型还不够完善,比如对于 M(Money),即消费金额相等的两个用户而言,一个是注册两年的老用户,一个是刚注册的新用户。对于企业来说,这两个用户的类型和价值就完全不同,因此我们需要更全面的模型。

 

LRFMC 模型提供了一个更完整的视角,能更全面地了解一个用户的特征,LRFMC 各个维度的释义如下:

 

L(lifetime):代表从用户第一次消费算起, 至今的时间,代表了与用户建立关系的时间长度,也反映了用户可能的活跃总时间。

 

R(Recency):代表用户最近一次消费至今的时间长度,反映了用户当前的活跃状态。

F(Frequency):代表用户在一定时间内的消费频率,反映了用户的忠诚度。

M(Monetary):代表用户在一定时间内的消费金额,反映了用户的购买能力。

C(CostRatio):代表用户在一定时间内消费的折扣系数,反映了用户对促销的偏好性。

 

产品运营类

产品运营是一个长期的过程,需要定期对产品的使用数据进行监控,通过用户行为分析发现问题,从而确定运营的方向,同时也可以用于评估运营的效果。

 

产品运营的常用指标如下:

使用广度:总用户数,月活;

使用深度:每人每天平均浏览次数,平均访问时长;

使用粘性:人均使用天数;

综合指标:月访问时长=月活*人均使用天数*每人每天平均浏览次数*平均访问时长。

 

产品所处阶段不同,运营的侧重点也会有所不同。在产品初期,核心的工作是拉新,应该更加关注产品的使用广度,而产品的中后期,应该更加注重使用深度和使用粘性的提升。

 

对于不同的产品也需根据产品的性质来确定核心指标,比如,对于社交类产品,使用广度和使用粘性至关重要,而对于一些中台分析类产品,提升使用深度和使用粘性更有意义。

 

写在最后:在一款数据产品诞生前,应该是先有数据,再有分析,然后才是产品,分析的广度和深度直接决定了产品的定位和价值。

 

如果是做一款数据报表类的产品,那么需要了解核心指标,并建立综合指标的评估体系。如果是做一款分析决策类产品,那么还需要基于业务需求,将现有数据指标进行解构再重构。