编辑导语:在数据分析中,有各种各样的分析方法供我们使用。复杂的分析方法固然好用,但是日常工作中经常用到的还是基础的分析方法。本文作者为我们介绍了六种常见的分析方法,如果你能熟练的使用它们,相信能够解决许多的日常数据分析问题。
盘点:数据分析中最基本的分析方法 - 图1
日常数据分析中,尤其是业务分析中,常用的分析方法论主要是几大类,本文会介绍我认为比较关键的六大类常用方法,熟练地混合交叉使用这六大类基本方法,80%的日常数据分析问题都能解决。
下面我会介绍这些方法有哪些,并且给出实例介绍如何使用这些方法。

一、多维分析

所谓多维分析就是细分分析,做多维分析首先要明确2个方向:维度和指标。

  • 指标:指的是用来记录关键流程的,衡量目标的单位或方法,如DAU、留存率、转化率等。
  • 维度:指的是观察指标的角度,如时间、来源渠道、地理位置、产品版本维度等。

多维分析,就是在多个维度拆解,观察对比维度细分下的指标。实现将一个综合指标细分,从而发现更多问题。
盘点:数据分析中最基本的分析方法 - 图2

举个实际用途的例子,KPI拆解,制定明年的KPI目标:

  1. 第一步:指标拆解,商品营收=(新用户数+老用户数)×商品订单转化率×客单价;
  2. 第二步:对指标进行多维细分,新老用户可以再细分客群,比如孕妇群体、运动爱好者、学生、白领等;商品订单可以细分商品的类型、商品的价格、商品的供应商、商品的品牌影响力等;
  3. 第三步:根据历史业务发展情况,计算不同用户维度、不同商品维度下的商品营收;
  4. 第四步:求和不同用户维度、不同商品维度下的商品营收,即为商品总营收。

在越来越讲究精细化运营的今天,多维分析的作用越来越重要,管理层通常看的是综合指标,总值,但通常这些总值无法真正地发现问题。对于一线员工将总值拆解细分,才能发现问题,找到可落地的解决问题。

二、趋势分析

有对比才有分析,有对比数据才能产生意义,所以对比分析在实际数据分析中是非常重要的一种分析手段,最常用的是基于时间的对比分析。基于时间的对比分析,主要是指同一指标在不同时间周期的对比,主要分为同比、环比和定基比。

  1. 环比是指:与相邻的上一周期做对比,周期可以是时、日、周、月、季、年等。比如周环比,指的是本周与上一周的对比;
  2. 同比是指:两个周期同一个时间点的比较,目的是追踪周期性的变化;
  3. 定基比是指:和指定的时间基点对比。

盘点:数据分析中最基本的分析方法 - 图3

举个数据例子:如2017年10月的月同比,指的是2017年10月和2016年10月做对比,而2017年10月的月环比,指的是2017年10月和上一周期2017年9月做对比。

三、转化分析法(漏斗分析)

转化分析也叫漏斗分析,主要是分析分析产品流程或关键节点的转化效果,常借助漏斗图展现转化效果。

漏斗图是一种外形类似漏斗的可视化图表,该方法可以直观追踪产品的整体流程,追踪业务的转化路径,追踪不同生命阶段下的用户群体表现。漏斗分析常用的场景主要有:

  1. 产品流程的关键路径转化追踪,比如电商常用的购买流程;
  2. 业务价值路径的转化流程追踪,比如常用的AARRR模型的价值转化追踪;
  3. 虚拟流程类指标追踪,比如按生命周期区分的不同生命周期阶段的用户流转形态追踪。

举个例子,针对AARRR模型转化场景:
AARRR是Acquisition、Activation、Retention、Revenue、Refer这五个单词的首字母缩写。它主要阐述的是用户
从获取到激活,到留存,到产生营收,到口碑认可正向传播的一系列闭环效应。

我们可基于用户量计算出这些节点的转化率,从而判断哪些节点的转化率差,哪些节点还有优化的空间,再通过具体的运营手段来提升节点转化率。如下图中的活跃购买率仅33%,是否可以运营手段将其提升到40%呢?
盘点:数据分析中最基本的分析方法 - 图4

四、公式拆解法

所谓公式拆解法,就是对目标变量用已知公式进行拆解,从而快速找到影响目标变量的因素。公式拆解法没有固定的标准,一个目标变量在不同的场景下或者说为解决不同问题,需要利用公式拆解的细致程度也不一样。
常见的公式拆解的场景有:

1. GMV计算

GMV = 下单用户量客单价
=(新用户+留存用户+召回用户)
客单价
= (广告触达量 转化率 + 老用户留存率 + 召回触达用户量 召回率) (商品量*商品单价)

2. ROI计算

ROI = 收益/成本
=(销售单价*销售量)/(固定成本+可变成本)
(收益和成本也可以继续根据业务进行拆解)

3. DAU预估

A(n):第n天的新增用户;R(n):第n天的留存率
DAU(n) = A(n) + DAU(n-1) R(1)
= A(n) + A(n-1)
R(1) + DAU(n-2) * R(2)
= A(n)+A(n-1)R(1)+A(n-2)R(2)+… …+A(1)R(n-1)

4. 净资产收益率ROE

ROE = 当前净利润/当期平均净权益
= 利润率 总资产周转率 财务杠杆
= 净利润/销售收入 销售收入/总资产 总资产/权益

根据公式对目标变量拆解后,我们通常会对拆解后的变量做更精细的分析,并且提出可落地解决问题的解决手段。

如下图所示,这是电商/零食行业最常用的拆解解决问题的框架,为提升销售额,在实际解决问题中都要细化到广告拉新、用户分析、商品分析等层面。
盘点:数据分析中最基本的分析方法 - 图5

五、综合评估法

综合评估法是将多个指标综合成一个指标评估的方法。这种方法是非常常见的,如我们日常中的蚂蚁信用分、微博热度、游戏战绩排名等都是基于综合评估法实现的。

综合评价法的特点表现为:

  1. 评价过程是通过一些特殊的方法,按指标的重要性对多指标加权,多个指标的评价是同时完成的,而非一个一个逐次完成的;
  2. 在多指标整合进行综合评价指标的过程中,会涉及权重的设定;
  3. 综合评价法生成的综合指标不再是单纯意义上的单个指标的意思,而是多个指标的综合反映。

因此,对于综合评估法,赋权是非常重要的环节。而赋权的方法可分为两类:主观评估法和客观评估法。客观评估法是指:变异系数、熵分析、主成分分析等;主观评估法是指:层次分析法、专家赋权等。

1. 变异系数法

变异系数等于样本标准差除以样本均值,是衡量样本观测值变异程度的变量。而且因为变异系数是除以了样本均值,所以他是忽略了量纲的影响。那具体如何用变异系数定权重呢,具体步骤可以看下面:
第一步:对于每一个指标计算变异系数cvcv_i=样本标准差/样本均值= σ/μ
第二步:计算各个指标最终的权重
盘点:数据分析中最基本的分析方法 - 图6
基于以上的计算公式可以看出,对于变异系数法定义权重,如果一个指标可以明显区分不同的样本,那么就会有更高的权重;反之,如果样本在某个指标的表现上没有特别明显,即该指标区分样本的能力较弱,则应该给这个指标赋予比较小的权重。

2. 熵值法

熵的概念来源于热力学,后来被引入信息论,用以表示对不确定性的一种度量。信息熵一般用来反映信息量的大小,信息量越大,不确定性越小,熵就越小;反之,信息量越小,不确定性越大,则熵就越大。
信息熵的计算方式如下:
假设有随机变量X,对应的值分分别为x1, x2, …, xn对应的概率分别为pi,信息熵为:
盘点:数据分析中最基本的分析方法 - 图7
具体基于信息熵计算权重的方法步骤如下:
第一步:计算指标的比重假设有n个样本,m个指标,xij为第i个样本第m个指标的值。因为不知道样本对应的具体指标的概率,可以用m指标下n样本对应的指标值占该指标总值的比率来表示。第xij指标的比重pij为:
盘点:数据分析中最基本的分析方法 - 图8
第二步:计算第j项指标的熵值
盘点:数据分析中最基本的分析方法 - 图9
第三步:计算各项指标的权重
盘点:数据分析中最基本的分析方法 - 图10
第四步:计算各个样本的综合得分
盘点:数据分析中最基本的分析方法 - 图11
计算出的综合得分是[0,1],可通过开根号再乘以100的方式,将其映射到[0,100]。

3. 层次分析法

层次分析法(AHP)是运筹学中的概念,是指将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。

如下所示,要计算总得分,可以将其拆解为质量、互动、消费、发布、附件这五个准则,对于这五个准则有再细分的方案。
盘点:数据分析中最基本的分析方法 - 图12
那具体怎么定义权重,大体思路是:由专家分别在每一个准则的细分方案下,对细分方案两两之间评重要程度(如1-9,1是同等重要,9是一方极端重要)。

再基于重要程度,可通过层次分析法的计算公式计算出每个细分方案的权重;同理可对五个准则进行重要评估,从而计算出五个准则的权重。具体方法可百度,百度上有详细的计算公式。

六、结构化分析

所谓结构化分析,其实就是逻辑树和MECE的结合使用。

逻辑数是麦肯锡推广的思考问题的工具,就是将目标问题像树一层一层拆解,最左边是“树根”(目标/问题的起点),朝右是将某已知问题的影响层当成已知问题的树枝,每多一个影响层,则添加一个树枝,直到列出已知问题的所有影响层为止。

且各逻辑树枝之间的关系需要“相互独立、完全穷尽”(MECE)。

结构化分析是非常好用的一种方法,它能将问题层层有序拆解,有助于思路清晰,同时可以将复杂问题由繁化简。下面以一个应用场景来举例说明:
比如要分析某App用户流失的原因,穷举用户流失的影响因素,做出逻辑树。
盘点:数据分析中最基本的分析方法 - 图13
虽说结构化分析非常好用,但是构建一个完美的框架(逻辑树)可不是一件容易事,一般构建结构框架有两种方法:自下而上和自上而下。

1. 自下而上

自下而上的意思是:先头脑风暴罗列可能的影响因素,再对罗列的影响因素归类分解形成框架。
盘点:数据分析中最基本的分析方法 - 图14
下面以一个应用场景来举例说明,比如如何在2年内赚到100万元?
1)第一步:罗列要点
盘点:数据分析中最基本的分析方法 - 图15
2)第二步:连线归类
一般是从时间、结构、重要性三个维度进行归类。
3)第三步:形成框架
盘点:数据分析中最基本的分析方法 - 图16
4)第四步:检查是否有重复和遗漏

2. 自上而下

自上而下的意思是:已经有可套用解决的框架,将需要解决的问题按照框架拆解,最后形成针对目标问题的结构框架。现有的成熟的框架特别多,比如4P、4C、SWOT、PEST、5W2H等等。
盘点:数据分析中最基本的分析方法 - 图17

3. 自上而下和自上而下对比

从上面的讲解很容易看出两种构建框架的区别,具体的对比整理如下,日常中可为了提高框架输出能力而有针对性的训练。
盘点:数据分析中最基本的分析方法 - 图18
以上就是我要介绍的常用数据分析方法,掌握上述方法,我相信80%的数据分析问题都能得到合理的分析思路。但在实际场景中,很少仅用单一方法就能直接解决问题,大多数情况下都要综合上述方法中的多种方法才可。
比如电商场景下的如何提升销售额问题?就要用到公式法、转化分析法、多维分析法及结构分析法,经过这样一系列分解才能获得可落地化的解决方案(公式拆解法里贴的示例图就有比较详细的逻辑拆解过程)。

作者:须臾即永恒;个人公众号:须臾即永恒


产品教练

产品教练