什么是数据:
事实或观察的结果。是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。
数据可以是数值型的,也可以是文本型的。

按照业务分类的三类数据:用户数据、行为数据、产品数据

一、 指标

1.1 常见的业务指标

1.用户数据指标

  • 日新增用户数
  • 活跃率
  • 留存率

image.png

2.行为数据指标

  • PV和UV
  • 转发率
  • 转化率
  • K因子 (K-factor,来衡量推荐的效果)

K因子=平均每个用户向多少人发出邀请×接收到邀请的人转化为新用户的转化率。
假设平均每个用户会向20个朋友发出邀请,而平均的转化率为10%的话,K因子=20×10%=2。
当K>1时,新增用户数就会像滚雪球一样增大。如果K<1的话,那么新增用户数到某个规模时就会停止通过自传播增长。

3.产品数据指标
产品数据相关的指标包括:用来衡量业务总量的指标,例如成交总额、成交数量;用来衡量人均情况的指标,例如客单价;用来衡量付费情况的指标,例如付费率、复购率;以及与产品相关的指标。
image.png

  • 总量

总量用来衡量业务总量的指标有:成交总额、成交数量、访问时长。
分析报告中经常出现的GMV(Gross Merchandise Volume),它就是指成交总额,也就是零售业说的“流水”。需要注意的是,成交总额包括销售额、取消订单金额、拒收订单金额和退货订单金额。

  • 人均

用来衡量人均情况的指标有人均付费(ARPU,Average Revenue Per User,在电商行业也叫“客单价”)、付费用户人均付费(ARPPU,Average Revenue Per Paying User)、人均访问时长。

  • 付费

付费相关的指标有付费率(反映产品的变现能力和用户质量)、复购率(反映用户的付费频率)。

  • 产品

产品相关的指标是指从产品的角度去衡量哪些产品好,哪些产品不好。通过找出好的产品来进行重点推销,不好的产品去分析原因。
常见的几个指标是热销产品数、好评产品数、差评产品数。这里可以根据具体的业务需求,灵活扩展使用。

image.png

4.推广付费指标
在付费做广告推广时,涉及考察推广效果的指标。从不同的付费渠道可以分为以下指标:

  • 展示位广告

展示位广告出现在网站或手机App的顶部、App的开屏等。
这种类型的广告通常是按展示次数付费(CPM,Cost Per Mille),也就是有多少人看到了该广告。

  • 搜索广告

例如搜索引擎(百度等)的关键字搜索广告、电商搜索广告(淘宝直通车等)。
这种类型的广告是按点击次数付费(CPC,Cost Per Click),也就是有多少人点击了该广告。

  • 信息流广告

例如微博、今日头条、知乎、朋友圈(信息流)里的广告。这种广告是根据用户的兴趣爱好来推荐的。这种类型的广告按点击次数付费(CPC)或者按投放的实际效果付费(CPA,Cost Per Action)。

按投放的实际效果付费(CPA,Cost Per Action)包括:

  • CPD(Cost Per Download):按App的下载数付费;
  • CPI(Cost Per Install):按安装App的数量付费,也就是下载后有多少人安装了App;
  • CPS(Cost Per Sales):按完成购买的用户数或者销售额来付费。

在决定将产品投放到哪个渠道的时候,要清楚你的目标用户是谁,目标用户在哪。

一般来说,如果是推广一个新的产品,要选择按App的下载数付费(CPD)。因为新产品还没有人知道,用下载数来衡量,是比较划算的。等有一定的品牌影响力积累了,再用按点击次数付费(CPC)或者按投放的实际效果付费(CPA)

1.2 如何选择指标

(1)好的数据指标应该是比例。通常要想理解一个数字的真实含义,最好把它除以一个总数,换算成一个比例。

(2)根据目前的业务重点,找到北极星指标。北极星指标就是衡量业务的核心指标。在实际业务中,北极星指标一旦确定,可以像天空中的北极星一样,指引着全公司向着同一个方向努力。
image.png

指标体系和报表

指标体系=指标+体系

指标体系的作用包括:
· 监控业务情况;
· 通过拆解指标寻找当前业务问题;
· 评估业务可改进的地方,找出下一步工作的方向。

1.3 如何建立指标体系

(1)明确部门KPI,找到一级指标。
一级指标是用来评价公司或部门运营情况最核心的指标。
一级指标并非只能是一个指标,有可能需要多个指标来综合评价。

(2)了解业务运营情况,找到二级指标。
有了一级指标以后,可以进一步将一级指标拆解为二级指标。具体如何拆解,要看业务是如何运营的。例如销售部门一般按地区运营,就可以从地区维度拆解。市场部门一般按用户运营,就可以从用户维度拆解。
image.png

(3)梳理业务流程,找到三级指标。
一级指标往往是业务流程最终的结果,例如积分抵扣金额,是业务流程(会员->购买旅游产品->使用积分抵扣->支付金额)最后的一个结果。
光看一个最后结果是无法监督、改进业务流程的,这就需要一些更细致的指标,也就是添加三级指标。
例如,在业务流程不同会员等级可以抵扣的金额不一样,不同旅游产品线可以抵扣的金额比例也不一样。所以,需要把二级指标按照业务流程拆解为更细的三级指标。在会员业务节点可以拆解为LV1级会员数、LV2级会员数、LV3级会员数、LV4级会员数。在购买旅游产品业务节点可以拆解为酒店订单数、机票订单数、跟团游订单数、自由行订单数。

把每个业务流程进行细分。
image.png
指标体系金字塔:

image.png

每个指标可以从3个方面确定统计口径:
· 指标业务含义:这个指标在业务上表示什么?
· 指标定义:这个指标是怎么定义的?
· 数据来源:从什么地方收集的原始数据?数据统计的时间范围是什么?

(4)通过报表监控指标,不断更新指标体系
报表就是报告状况的表,是通过表格、图表来展示指标,从而方便业务部门掌握业务的情况。每天汇总更新的报表叫做日报,每周汇总更新的报表叫做周报。

image.png

二、分析方法

为什么要学习分析方法?首先来看以下几个症状。

  1. 症状一:没有数据分析意识。

症状表现:经常会说“我觉得”“我感觉”“我认为”。
这类人一切工作靠拍脑袋决定,而不是靠数据分析来支持决策。导致花费很多精力却没有效果,也不知道为什么没有效果。
他们靠感觉来做事情,而不是用数据分析来做决策。这也是为什么他们浑浑噩噩工作了多年以后,却依然徘徊在基础岗位。

  1. 症状二:统计式的数据分析。

症状表现:做了很多图表,却发现不了业务中存在的问题。
这类人每天也按时上班,也用数据做了很多图表,但是只是统计、分析之前已经知道的现象。例如分析结论只是“这个月销售有所下降”,却不会深入分析现象背后发生的原因,从而也得不出什么具有价值的结论。
他们最害怕老板问这样的问题:为什么这个数据会下降?采取什么措施可以解决问题?

  1. 症状三:只会使用工具的数据分析。

症状表现:这类人平时学了很多工具(Excel、SQL或者Python等),谈起使用工具的技巧头头是道,但是面对问题,还是不会分析。

image.png
例如面试或者工作里经常遇到这样的问题:
上图表格是一家公司App的一周日活跃率(DAU),老板交给你以下任务:
(1)从数据中你看到了什么问题?你觉得背后的原因是什么?
(2)提出一个有效的运营改进计划。

你可能有这样的感觉:
面对问题,没有思路,怎么办呢?
面对一堆数据,我该如何下手去分析呢?

这些症状是大部分运营人员、产品经理和数据分析相关从业人员的真实日常写照。学会分析方法就是帮助你解决这些问题,它可以弥补你数据分析能力的不足

什么是分析方法?
面对问题,通常的想法是零散的,没有一点思路。如果能将零散的想法整理成有条理的思路,从而快速解决问题,那该多好呀!
有什么方法可以将零散的想法整理成有条理的分析思路呢?这些方法就是分析方法。掌握了分析方法就可以具备这种能力。
image.png

将分析方法和盖房子做个类比,分析方法就好比在盖房子前画的设计图,用来指导如何盖房子,是分析问题的思路。数据分析的技术工具好比盖房子中的挖土机等工具。在设计图的指导下才知道如何使用挖土机来盖好房子。同样,在分析方法的指导下你才能知道如何使用工具(Excel、SQL或者Python等)去分析数据,解决业务问题。

常用的分析方法有哪些?
根据业务场景中分析目的的不同,可以选择对应的分析方法。
常用的分析方法如下表所示。

分析目的 分析方法 案例
将复杂问题变得简单 逻辑树分析方法 费米问题
行业分析 PEST分析方法 中国少儿编程行业研究
多个角度思考 多维度拆解分析方法 如何找相亲对象?
对比 对比分析方法 女朋友胖吗?
如何分析原因 假设检验分析方法 警察是如何破案的?
A和B有什么关系 相关分析方法 豆瓣如何推荐电影?
留存和流失分析 群组分析方法 微博
用户价值分类 RFM分析方法 信用卡会员服务
用户行为分析 AARRR模型分析方法 拼多多
转化分析 漏斗分析方法 店铺哪个环节有问题?

在工作或者面试中,会经常听到分析思维、分析思路、分析方法。这三个词语有什么关系呢?
其实简单来说,它们都是指分析方法。因为分析方法是将零散的想法整理成有条理的分析思路。有了分析思路,你就具备了分析思维。

下文在讲到每一个分析方法的时候,会从4个问题出发来学习:
(1)是什么?先知道这个知识是什么;
(2)有什么用?知道在什么场景下使用这个知识;
(3)如何用?通过实际例子来看这个知识如何使用;
(4)使用这个知识的注意事项。

2.1 5W2H分析方法

2.1.1 5W2H分析方法是什么?

5W是指对于所有的现象都追问5个问题:what(是什么)、when(何时)、where(何地)、why(为什么)、who(是谁)。
2H是指再追问2个问题:how(怎么做)、how much(多少钱)。

当遇到要解决的问题,可以从5W、2H这7个问题出发来解决。

2.1.2 5W2H分析方法能解决哪些问题?

5W2H分析方法可以帮助我们解决简单的问题,下面举几个例子。

案例1:如何设计一款产品?
这时候可以用5W2H分析方法:
what(是什么):这是什么产品?
when(何时):什么时候需要上线?
where(何地):在哪里发布这些产品?
why(为什么):用户为什么需要它?
who(是谁):这是给谁设计的?
how(怎么做):这个产品需要怎么运作?
how much(多少钱):这个产品里有付费功能吗?价格是多少?

案例2:设计一款App的调查问卷,如何设计问卷上的问题?
这时候可以用5W2H分析方法:
what(是什么):你用这款App做什么事情?
when(何时):你通常在什么时间使用这款App?
where(何地):你会在什么场景使用这款App?
why(为什么):你为什么选择这款App?
who(是谁):如果你觉得你喜欢这个产品,你会推荐给谁?
how(怎么做):你觉得我们需要加入什么功能才是比较新颖的?
how much(多少钱):如果你认为这个App对你有帮助,你会花多少钱去购买App里的服务?

2.1.3 5W2H分析方法解决不了什么问题?

5W2H分析方法很好理解,但是在复杂的商业问题面前不起作用。这是因为复杂的商业问题不会只有一个原因,而是由多个原因引起的。例如“销量为什么下降”,就可能是由多个原因导致的。这时候就需要运用其他分析方法。

2.2 逻辑树

逻辑树分析方法是把复杂问题拆解成若干个简单的子问题,然后像树枝那样逐步展开。
image.png
为了更符合人类的思考过程,我们把这棵树倒过来,或者横着放,就是常用的逻辑树分析方法。通过逻辑树分析方法,我们可以把一个复杂的问题变成容易处理的子问题。

不管是实际生活中还是工作中,我们经常会使用逻辑树分析方法来分析问题。例如现在你想给自己做一个年度计划,但是要做的事情很多,思路很零散。为了理顺你的思路,可以用逻辑树分析方法,把年度计划这个复杂问题拆分成技能学习、读书、健身、旅行这几个子问题。
image.png

逻辑树分析方法是由科学家费米提出来的,这种分析问题的方法在面试中会经常用到,例如:北京有多少辆特斯拉汽车?某胡同口的煎饼摊一年能卖出多少个煎饼?深圳有多少个产品经理?一辆公交车里能装下多少个乒乓球?一个正常成年人有多少根头发?这类估算问题,被称为“费米问题”。为什么面试会问这种问题呢?
image.png
这类问题能把两类人清楚地区分出来:一类是具有文科思维的人,他们擅长赞叹和模糊想象,主要依靠的是第一反应和直觉,例如小孩;另一类是具有理科思维的人,他们擅长通过逻辑推理、分析解决具体问题。理科思维不是人天生就有的,需要经过长期的训练。

公司招聘需要的是能把事情做成、具有严密逻辑推理、分析能力的人,所以费米问题可以考察出一个人有什么样的思维方式。一般人拿到费米问题,就会摸不着头脑,不知道怎么解决,干脆凭感觉瞎猜一个数字。这其实忽视了面试官考察的目的,他不是要你算出一个确定的数字,而是想考察你面对问题的分析思路。所以,你需要把自己的思路说出来,来证明你的思维方式是理科思维。

回答费米问题,可以用到逻辑树分析方法,将一个复杂的问题拆解成子问题,然后逐一解决。

“芝加哥有多少钢琴调音师?”
问题拆解:
(1)全部钢琴调音师1年的总工作时间;
(2)一位调音师每年工作时间。

“全部钢琴调音师1年的总工作时间”问题拆解:
(1)有多少架钢琴;
芝加哥的人口可以通过网络查出来,大概有250万人。钢琴贵且占地,猜家庭拥有钢琴的比例是1%(通常表示概率极低),再加上其他机构的数量,估计是和家庭数量一致,合计2%。算出芝加哥大概有5万架钢琴。
(2)钢琴每年要调几次音;
钢琴调音师属于稀缺行业,人肯定不多,钢琴也不像吉他需要频繁地调音,估计是一年1次。
(3)调一次得多长时间。
大概是2小时。

“一位调音师每年工作多长时间?”
美国每年有四个星期是假期,一年大概有50个星期。按一周工作5天,每天8小时来算,这三个数相乘,就可以得到一位调音师每年工作时间是2000小时。但是钢琴调音师要四处跑,路上肯定要花时间,所以减去20%用在路上的时间,调音师每年大概工作1600(2000-2000×20%)小时。

image.png

注意事项:
需要注意的是,逻辑树分析方法在解决业务问题时,经常不是单独存在的,会融合在其他分析方法里,辅助解决问题。在后面其他分析方法的学习中,你会看到使用了逻辑树的拆解图,来将一个复杂问题拆解成各个子问题。

2.3 行业分析方法

什么时候需要进行行业分析?
当个人在对自己进行职业规划,思考选择哪个行业更好的时候;当公司需要对外部环境或者行业竞争对手有所了解,制定发展规划的时候;当面对重大问题,需要分析行业问题的时候。

如何进行行业分析?
使用PEST分析方法。
PEST分析方法是对公司发展宏观环境的分析,所以经常用于行业分析。通常是从政策、经济、社会和技术这四个方面来分析的。 《数据分析思维》学习笔记 - 图15

如何使用行业分析方法?
现在通过一个具体的例子来看下如何应用PEST分析方法。

  • 政策环境主要包括政府的政策、法律等。

例如可以从这样几个问题去展开研究:

  • 相关法律有哪些?对公司有什么影响?
  • 投资政策有哪些?对公司有什么影响?
  • 最新的税收政策是什么?对公司有什么影响?

image.png

  • 经济环境主要指一个国家的国民收入、消费者的收入水平等。经济环境决定着公司未来市场能做多大。下图艾瑞网《2018年中国少儿编程行业研究报告》的经济环境分析,从中可以得出教育重要性促使支出提升。

image.png

  • 社会环境主要包括一个地区的人口、年龄、收入分布、购买习惯、教育水平等。

下图是艾瑞网《2018年中国少儿编程行业研究报告》的社会环境分析,从中可以得出适龄人口数量的增长促使家长着眼未来。
image.png

  • 技术环境是指外部技术对公司发展的影响。

下图是艾瑞网《2018年中国少儿编程行业研究报告》的技术环境分析,包括5G技术、大数据等。
image.png

2.4 多维度拆解分析法

案例:
假设在每个医院最近收治的1000例患者中,A医院有900例患者存活。然而,B医院只有800例患者存活。这样看起来,A医院的存活率更高,应该选择A医院。你的选择真的是正确的吗?
image.png
现在我们使用多维度拆解分析方法来看下。光看患者整体时,我们可能注意不到“数据构成要素的差异”。现在根据患者的健康状况,我们将每家医院入院的总人数拆解为两组,一组是轻症患者,一组是重症患者。然后我们再来计算患者存活率,会有什么发现呢?
image.png
我们来比较A医院和B医院的重症患者组。A医院有100例患者入院时是重症患者,其中20例存活。B医院有400例患者入院时是重症患者,其中200例被救活了。所以,对于重症患者,去B医院的存活率更高,是更好的选择(图2-26)。
image.png
那如果亲人入院时是轻症患者呢?
用同样的方法分析,出人意料,轻症患者在B医院的生存率((800-200)/(1000-400)=100%)也超过了A医院的生存率((900-20)/(1000-100)=97.78%),B医院依旧是更好的选择。

通过多维度拆解数据,我们发现了和一开始截然相反的结论,这种现象被称为“辛普森悖论”(Simpson’s Paradox),也就是在有些情况下,考察数据整体和考察数据的不同部分,会得到相反的结论
只看数据整体,我们可能注意不到“数据内部各个部分构成的差异”。如果忽略这种差异进行比较,就有可能导致无法察觉该差异所造成的影响

所以需要从多个维度去观察数据,并相互验证,才能得出相对可靠的结论。例如我们可以把用户拆解成:用户=老用户(维度1)+新用户(维度2),从而可以看到老用户和新用户的数据表现分别是什么。

2.4.1 如何使用多维度拆解分析方法?

1)从指标构成来拆解
分析为何某次促销活动没达成预期销售额?
销售额=新用户销售额+老用户销售额
新用户销售额=新用户数×转化率×新用户客单价;老用户销售额=老用户数×复购率×老用户客单价。

这样拆解后,有利于后续找到原因来制定对应的决策。如果是“新用户”导致的销售额目标没达成,可以对新用户发小额无门槛的折扣券,因为新用户往往还没有对店铺建立信任,不会第一次就购买很多。如果是“老用户”导致的销售额目标没达成,可以对老用户发高额满减折扣券,起到提升复购率的效果。

2)从业务流程来拆解
分析某次线上的推广效果如何?
推广效果最直观的是看用户增长了多少,定义衡量指标为新增用户数。这里的新增用户数是指看到推广渠道的广告,进入店铺的人数。
可以按指标构成如城市、性别、渠道来拆解新增用户数。

按照地域细分,考察一线、二线、三线及以下等不同城市的新增用户数量情况。
按照性别细分,考察男性用户、女性用户分别是多少。
按照渠道细分,考察公众号、百度、头条哪个渠道的用户来源多。

从地域维度来看,北京、上海等一线城市新增用户多,说明一线城市的用户对公司产品更感兴趣。
image.png

从性别维度来看,男性用户多于女性用户。
image.png

从渠道维度来看,假设渠道A新增用户数最多,渠道B新增用户数接近A,渠道C新增用户数最少。那么,渠道A、渠道B、渠道C哪个用户渠道的质量更高呢?
image.png

店铺做推广的目的,最终是为了给店铺带来销量,所以我们可以从业务流程来拆解分析,考察哪个渠道来的用户更愿意在店铺购买。

我们可以继续从业务流程来拆解渠道数据。用户购买的业务流程,可以分为4步:
第1步,看到渠道的广告;
第2步,被广告吸引进入店铺;
第3步,在店铺选择感兴趣的商品;
第4步,选择好商品,最终决定购买。

按业务流程拆解后,我们看到虽然渠道A带来的用户多,但是最终购买人数却低于渠道B带来的用户数。所以,渠道B的用户质量更高。
image.png

具体案例:分析某个App留存率低的原因
再来看一个案例,来更加熟悉多维度拆解分析方法。
有一款App,在观察用户留存率的时候,发现低年龄用户的留存率比高年龄用户的留存率低很多。这里的低年龄用户是指18岁以下的用户,例如初中生、高中生。进一步观察发现,这些低年龄的用户大多是使用一下App就再也不用了。
根据这个问题,可以从指标构成、业务流程来拆解问题。

1)从指标构成拆解
如果把18岁以下都算作低龄,那么这个划分又不够细,因为18岁以下包含了3个学生阶段:小学生、初中生、高中生。不同学生阶段的用户行为差异是比较大的,所以可以按年龄维度来细分。
由此得到分析维度1:不同的低龄用户表现是否有差异?

2)从业务流程拆解新用户使用App的业务流程如下:
新用户下载App然后注册 → 首页推荐(注册时选择的感兴趣话题)→在App里搜索自己感兴趣的内容
image.png

从指标构成和业务流程拆解,我们就将一个复杂的问题拆解为3个子问题:
image.png

总结:
image.png

在有些情况下,考察数据整体和考察数据的不同部分,会得到相反的结论。使用多维度拆解分析方法,可以防止“辛普森悖论”。

2.5 对比分析法

在数据分析中,我们通过对比分析方法,来追踪业务是否有问题。例如,我的公众号日活跃率是4%,你说是高还是低?这个日活跃率有问题吗?这时候,就需要用对比分析方法来追踪业务是不是有问题。正所谓,没有对比就没有好坏

你看中一件299元的衣服,但是觉得贵,卖家拿出另外一件标价899的衣服,让你觉得299其实也不是很贵。
心理学家给这种现象发明了一个术语叫作价格锚定,也就是通过和价格锚点对比,一些商品会卖得更好。
image.png

《经济学人》是美国的畅销经济学杂志,它做过一个订阅实验,给用户以下3个选项进行选择:
(1)只订阅电子版,59美元一年;
(2)只订阅纸质版,125美元一年;
(3)订阅纸质版+电子版,125美元一年。

第2个选项和第3个选项的价格一样,但是第3个选项提供的服务更多。实验结果显示,只有16%的人选择了第1个选项,有84%的人选了第3个选项,也就是有更多的人愿意花更多的钱去订阅杂志。
image.png
如果把第2个选项去掉,对用户有影响吗?

去掉第2个选项,选择125美元(原来的第3个选项)的用户减少到了32%。
image.png
如果没有之前第2个选项,用户会和第1个选项对比,发现花125美元不划算。当有第2个选项的时候,用户就会将比较对象换成第2个选项,这样才能体现出第3个选项的优惠。

2.5.1 如何使用对比分析方法?

想要进行对比分析,我们要弄清楚两个问题:和谁比,如何比较。

1.和谁比
和谁比一般分为两种:和自己比,和行业比。

雷军在小米上市之前做了一个公开承诺:“小米的硬件综合净利润率永远不会超过5%。如有超过的部分,将超出部分全部返还给用户。”我们用对比分析方法来分析下这句话背后的真实含义。
1)和自己比
在小米的招股说明书中可以看到,小米2015年的硬件毛利率是-0.3%,2016年是3.4%。净利润率=毛利率-其他成本,所以再考虑上其他成本,小米和自己的历史业绩比,硬件净利润率肯定小于5%。

2)和行业比
遇到问题,想知道是行业趋势还是自身原因,就可以和行业值对比。作为硬件行业的领头羊海尔公司,在2017年净利润率是4.3%,也达不到5%。所以,通过对比分析方法可以看出,硬件净利润率能达到5%的公司几乎就没有,所以雷军这个承诺其实是一种经过数据分析得出的结论,既不会让小米陷入无法实现承诺的困境,又可以在用户心中留下“小米性价比高”的产品形象。

2.如何比较
一般从3个维度比较:数据整体的大小、数据整体的波动、趋势变化。
image.png
1)数据整体的大小
某些指标可用来衡量整体数据的大小。常用的是平均值、中位数,或者某个业务指标。

2)数据整体的波动
标准差除以平均值得到的值叫作变异系数。变异系数可用来衡量整体数据的波动情况。

3)趋势变化
趋势变化是从时间维度来看数据随着时间发生的变化。常用的方法是时间折线图,环比和同比。
时间折线图是以时间为横轴、数据为纵轴绘制的折线图。从时间折线图上可以了解数据从过去到现在发生了哪些变化,还可以通过过去的变化预测未来的动向。
环比是和上一个时间段对比,用于观察短期的数据集。例如本周和上周对比,本月和上月对比(某数据在2020年12月比2020年11月下降10%)。
同比是与去年同一个时间段进行对比,用于观察长期的数据集。例如某数据在2020年12月比2019年12月下降10%。

在实际应用对比分析方法的时候,为了防止遗漏我们可以用下图的“对比表格”来记录比较的维度,防止遗漏重要信息。
其中,第一列是比较的维度,中间几列是比较对象,最后一列是比较结论,用于记录每一行的比较结果。
image.png

2.5.2 注意事项

在进行比较的时候,要注意比较对象的规模要一致。
例如下图,折线图的横轴是月份,纵轴是每天平均销售额。从这个折线图反映的趋势来看,似乎可以得出比较结论:地区B的业务没有其他地区的好。
当不同地区的商店数量不一样时,直接对比各地区总体销量这是不可行的。
image.png
可以用每个地区的销售额除以店铺数量,这样就可以算出各个区域的单个店铺的平均销售额。从下图可以发现,与其他地区相比,地区B的销售业绩并不差。
image.png

A/B测试的背后也是用了对比分析方法。
什么是A/B测试?
简单来说,A/B测试就是为同一个目标制定两个版本,这两个版本只有某个方面不一样,其他方面保持一致。例如两个版本只有按钮的颜色不一样,让一部分用户使用A版本(实验组),另一部分用户使用B版本(对照组)。试运行一段时间后,分别统计两组用户的表现,然后对两组数据进行对比分析,最后选择效果更好的版本正式发布给全部用户。
image.png

总结:
image.png

2.6 假设检验分析方法

假设检验分析方法是一种使用数据来做决策的过程。假设检验分析方法分为3步:
image.png
由于假设检验分析方法背后的原理是逻辑推理,所以学会这个方法以后,可以显著提高我们的逻辑思维能力。
假设检验分析方法的另一个作用是可以分析问题发生的原因,也叫作归因分析。例如面试过程中,面试官问“为什么申请量上升了,放款量反而下降了?”这类问“为什么”的题是工作中经常遇到的场景,例如是什么原因导致活跃率下降等。这类问题就是分析原因。通过找到问题发生的原因,才能根据原因制定对应的策略。

2.6.1 如何使用假设检验分析方法?

人们建立假设时,很容易依赖之前的经验做出假设,这可能会无意识地排除一些重要的假设。

如何客观地提出假设?
我们可以按用户、产品、竞品这3个维度提出假设,来检查提出的假设是否有遗漏
这3个维度分别对应公司的3个部门:用户对应运营部,产品对应产品部,竞品对应市场部。这3个维度有助于在发现问题原因以后,对应落实到具体部门上,有利于把问题说清楚。
image.png
从这3个维度,我们可以提出3种假设:
(1)假设用户有问题:可以从用户来源渠道这个维度来拆解分析,或者画出用户使用产品的业务流程图来分析原因;
(2)假设产品有问题:可以研究这段时间销售的产品是否符合用户的需求;
(3)假设是竞品导致的问题:可以看竞品是不是在搞什么优惠活动,用户跑到竞争对手那里了。

还可以从4P营销理论出发来提出假设
什么是4P营销理论呢?
4P营销理论产生于20世纪60年代的美国,它是随着营销组合理论的提出而出现的。营销组合实际上有几十个要素,这些要素可以概括为4类:产品、价格、渠道、促销。
(1)产品:公司提供给目标市场的有形或无形产品,包括产品实体、品牌、包装、样式、服务、技术等;
(2)价格:用户购买产品时的价格,包括基本价格、折扣价格、付款期限及各种定价方法和定价技巧等;
(3)渠道:产品从生产公司到消费用户所经历的销售路径。
(4)促销:是指企业利用各种方法刺激用户消费,来促进销售的增长。包括广告、人员推销、营业推广等。例如买一送一、过节打折等。

为了寻找销售业绩下降的原因,可以利用4P营销理论从4个维度提出假设。
image.png
从业务流程提出假设,这里其实是用到了我们之前讲过的多维度拆解分析方法。

总结:
image.png

第1个问题:是什么?
假设检验分析方法就是逻辑推理,是一种使用数据来做决策的过程。它分为3步:提出假设,收集证据,得出结论。

第2个问题:有什么用?
假设检验分析方法背后的原理就是逻辑推理,所以学会这个方法以后,可以显著提高我们的逻辑思维能力。假设检验分析方法的另一个作用是可以分析问题发生的原因,也叫作归因分析。以后分析问题发生的原因,就可以使用假设检验分析方法。

第3个问题:如何用?
可以使用3个方法来客观地提出假设,同时防止遗漏假设:
(1)从用户、产品、竞品这3个维度提出假设;
(2)从4P营销理论提出假设;
(3)从业务流程提出假设。

第4个问题:注意事项。
需要注意4个地方:
(1)第3步得出的结论不是主观猜想出来的,不能是“我猜、我觉得、我认为、我感觉”,而是要依靠找到的证据去证明结论;
(2)假设检验这3步是一个需要不断重复的过程。在得出结论以后,分析还没有停止,要多问几个为什么、可能的原因是什么,然后用数据去验证可能的原因。不断重复假设分析的这个过程,直到找到问题的根源;
(3)在使用假设检验分析方法的过程中,还要用到其他分析方法,例如前面的案例里在第1步提出假设的过程中,使用了多维度拆解分析方法;在第2步收集证据的过程中,使用了对比分析方法;
(4)在开始分析之前,为了理清楚思路,可以做一个图,将问题、假设、数据从上至下连起来。

以后在使用假设检验分析方法时,只需要记住以下两张图就可以。
①假设检验分析方法的步骤。
image.png
②分析思路图,可以帮助你快速地将问题、假设、数据从上至下连起来。
image.png

2.7 相关分析方法

image.png
第1个问题:是什么?
当我们研究两种或者两种以上数据之间有什么关系的时候,就要用到相关分析。

第2个问题:有什么用?
(1)在研究两种以上数据之间有什么关系,或者某个事情受到其他因素怎样的影响等问题的时候,就可以使用相关分析;
(2)在解决问题的过程中,相关分析可以帮助我们扩大思路,将视野从一种数据扩大到两种甚至多种数据;
(3)通俗易懂,便于和其他人沟通,方便得到他人的理解和认可;
(4)相关分析可以和其他分析方法相结合,帮助进行深入分析。

第3个问题:如何用?
相关分析就是得到相关系数,相关系数有两个作用:
(1)相关系数的数值大小可以表示两种数据的相关程度。一般相关系数的值大于0.6或者小于-0.6,表示两种数据之间高度相关;
(2)相关系数的数值正负可以反映两种数据之间的相关方向。
通常,在做相关分析的时候,会在散点图上给出相关系数。还介绍了一种应用相关分析的模式,就是找出哪些因素与分析目标相关。

第4个问题,注意事项。
需要注意的是相关关系不等于因果关系。

如何判断两种数据之间是相关关系,还是因果关系呢?
要用到“单变量控制法”,也就是控制其他因素不变,只改变其中一个因素,然后观察这个因素对实验结果的影响。

什么时候需要相关关系,什么时候需要因果关系呢?
大部分时候无法找到因果关系,但是仅仅知道相关关系也能帮助我们。对于有些问题,需要找出事件背后的原因。这时候就需要先通过研究发现相关关系,然后再进一步去找出背后的原因,找出事件之间的因果关系。

2.8 群组分析方法

“群组分析方法”(也叫同期群分析方法)是按某个特征,将数据分为不同的组,然后比较各组的数据,说白了就是对数据分组然后来对比。

2.8.1 群组分析方法有什么用?

产品会随着时间发布新的版本,产品改版的效果如何?版本更新后用户是增长了,还是流失了?像这类问题,就需要将用户按时间分组,然后比较不同组的用户留存率。所以,群组分析方法常用来分析用户留存率(或者流失率)随时间发生了哪些变化,然后找出用户留下或者离开的原因。

留存问题中如何对用户分组?
通常是按用户开始使用产品的月份来分组,例如用户注册的那个月或者第1次购买的那个月。分组后,考察每组用户的留存率随着时间发生了哪些变化,例如1个月后留存率是多少,2个月后留存率是多少。对留存率高的用户组,分析他们为什么留存;对留存率低的用户组,分析他们为什么流失。
image.png

2.8.2 如何使用群组分析方法?

假设现在是4月初,为了分析产品用户的留存,我们将前3个月的用户划分到不同的组。把在1月份注册产品的用户划分到一个组,叫作“1月份组”,把在2月份注册产品的用户划分到一个组,叫作“2月份组”,把在3月份注册产品的用户划分到一个组,叫作“3月份组”,初步整理得出下图的表格。
image.png
为了研究清楚每个组里的用户留存率随时间发生了哪些变化,可以给这个表加入几列,用于记录用户从开始注册产品到几个月后的留存率,这样就得到了以下表格。
image.png
第1行是1月份组用户的留存率随着时间的变化情况。为什么右下方有许多空白单元格?因为表格的制作时间是4月初,而3月份组里的用户是3月份开始注册产品的,1个月后才到了4月份,2个月后是5月份,3个月后是6月份,5月份和6月份都还没有数据,所以表格有空白。所以,对于这种群组分析表格,由于时间原因,右下角有些数据是空白。
image.png
表格里的留存率是多少?可以按行来计算。
image.png
例如,表格第1行是1月份组,1月份注册的有10个人,1个月后有6人卸载产品不再使用了,还留下4个人。那么1个月后的留存率=留下的人数(4)/1月份组总人数(10)=40%。

按同样的方法,可以算出每一行的留存率,最后得到下表。
image.png

从这个表格里能分析出什么?
当群组分析表格里的数据比较多的时候,直接分析起来比较困难。这时可以把各个组的数据绘制成折线图,这样从图形上就可以很容易地发现数据随时间发现了哪些变化。横轴是时间,纵轴是留存率。这样表格里的每个留存率在折线图上就是一个点,例如3月份组1个月后的留存率是10%,就是图2-120的红色点。把每个组的留存率数据点连成折线,就可以绘制出每个组的留存率折线图。
image.png
通过比较各个组的留存率折线图,可以发现3月份组的留存率突然下降了,然后就可以分析为什么这个月的留存率下降了。所以,通过群组分析方法,可以观察某个指标随着时间发生了哪些变化。

案例一:视频平台用户流失分析
腾讯、优酷、爱奇艺等视频平台,其用户是按月付费成为会员才能看某些电视剧。用户可以在任意月份取消订购,这类取消订购的用户就是流失用户。为了分析用户为什么流失,我们可以使用群组分析方法。
表2-6是某视频平台的新增用户数,表格的第1列“分组”是按新用户注册的月份分组,每一行是对应组之后各个月留存下来的用户(数据来源:《精益数据分析》)。
image.png
当群组分析表格里的数据较多,直接分析比较困难。这时可以把各个组的数据绘制成折线图,这样就可以很容易地发现数据随时间发生了哪些变化。把每个组的数据绘制成一条折线,横轴是时间,纵轴是留存率,然后比较各个组的折线。因为9月份组和10月份组的数据很少,所以没有绘制到图上。从图2-122中可以发现,当1、2、3月份组的折线趋于平稳时,4、5、6月份组的折线还在继续下行。
image.png
上图的折线太多,可以把1月份组和4月份组单独拿出来比较,如下图,可以看出两组的留存率差别很大。
image.png

通过群组分析方法,我们发现留存率低的是4、5、6月份组。接下来就可以继续分析为什么这3个月的用户留存率下降。
例如,有可能是下面几种原因:
(1)公司最近上线了新功能,但是这些新功能并不适合新用户;
(2)公司最近推广活动带来了新用户,但是公司的产品对这些新用户没有价值,导致用户流失。

这时就可以使用前文的假设检验、相关分析等方法来进一步研究,找到问题发生的原因。

最后我们复盘下用户流失分析这个案例。
第1步,使用群组分析方法,找到留存率低的组;
第2步,分析为什么这些组留存率低,可以使用假设检验、相关分析等方法进一步研究。
image.png

案例二:推特用户留存分析。
前面在使用“群组分析方法”时,一般按用户开始使用产品的月份来分组,但这不是唯一的分组规则。工作里业务场景不一样,需要灵活根据业务需求来确定分组规则。现在来看看推特团队是如何使用“群组分析方法”来发现留存率低的问题,以及如何分组的(案例来自《增长黑客》)。
推特是国外版的“微博”,在发展的早期阶段,团队通过数据分析发现,在新用户注册时,根据用户的兴趣选择,向他推荐30个最可能感兴趣的账号,这样才可以使新用户成为长期活跃用户。那么,为什么是关注“30个”用户账号呢?
这个数据可不是团队一拍脑袋决定的,而是使用群组分析方法得出的结论。当时,推特面临的是很多人注册后就不再使用产品了,留下来的活跃用户极少。为什么用户留存率低呢?为了解决这个问题,团队按每月使用推特的天数对用户进行分组分析。由于没有当时的真实数据,为了方便理解,下表中的数据是模拟数据。
image.png
“分组”这一列是某月份用户使用推特的天数,“当月用户数”这一列是对应这组里有多少用户,“1个月后用户数”是1个月后,有多少人留存下来继续使用产品。这样分组后,用“1个月后用户数”除以“当月用户数”,就可以得到各组的留存率。
image.png
将最后一列的留存率绘制成折线图,比较各组的留存率变化。其中,横轴是各个组,也就是这个月使用产品的天数,纵轴是每个组对应的留存率。从图中可以看出,当月使用推特7天是一个拐点,这之后留存率慢慢稳定在90%以上。也就是说,一个月使用至少7天的人中,有90%~100%会留存到下一个月。
image.png
那么,一个月使用至少7天的用户比例高吗?
推特团队将用户分为三组,分组规则如下:
(1)核心用户,也就是每个月至少访问7天的人;
(2)一般用户,也就是使用产品不那么频繁的人;
(3)冷漠用户,也就是使用一次产品后就不再用的人。

分组后统计每一组的用户比例,推特团队发现核心用户有20%,这个比例是比较高的。
image.png

核心用户组为什么留存率高呢?
如果能找到这些用户有哪些共同行为,那么就找到了用户留存下来的原因。接下来推特团队进行了相关分析,在前面的相关内容里,我们学习过应用相关分析解决问题的模式,就是找出哪些因素与分析目标有相关关系。例如,可以分别计算出因素A、B、C和“分析目标”的相关系数,通过观察这些相关系数的大小,得知哪些因素对“分析目标”影响大,哪些影响小。公司资源有限,一个阶段只能集中解决一个问题,通过相关分析,优先解决那些影响大的因素
image.png

推特团队通过相关分析发现,关注人数和留存率高度相关。当用户关注人数在30人以上,用户就会留存下来。通过继续深入分析,推特团队又找到了一组相关关系:用户关注的30个人里有多少人关注他们和留存率高度相关。
image.png

为什么回关人数越多,用户留存率越高呢?
为了找到这个问题的答案(因果关系),团队对用户进行了电话采访,发现了这背后的原因:如果不到1/3的人“回关”,那么推特就会像一个新闻网站,而市面上还有很多其他新闻网站可以选择;如果超过1/3的人“回关”,那么推特就跟其他社交产品没有什么区别,例如微信中大家都是互相关注的状态,也没法体现出推特的独特之处;只有达到1/3这个比例的时候,才能体现出推特的特点,也就是让用户及时了解他们关心的圈子里发生的新鲜事。
通过使用群组分析方法和相关分析方法,推特团队找到了用户留存率低的原因。最后,他们利用分析结论优化了产品,就是在新用户注册的时候,根据用户的兴趣选择向他推荐30个他最可能感兴趣的账号,这样才可以使新用户成为长期活跃用户。

现在复盘下前面的两个案例,就可以总结出使用群组分析解决问题的模式。
image.png

案例三:金融行业逾期分析。
贷款的流程:
①贷款申请人填写申请资料;
②贷款平台审核;
③如果通过审核,贷款平台会把贷款打入申请人的银行账户,也就是放款;
④在贷款到期时,申请人需要按时还款。如果申请人没有按时还款,那么贷款平台的催收人员会提醒还款。没有按时还款的用户,叫作逾期用户。
image.png
逾期率是贷款到期的用户里未还款用户的占比。例如,有1000名用户的贷款到期,过了还款日期,有100人没有还款,那么逾期率就是100/1000=10%。

平台放款后,万一用户不还款怎么办?作为贷款平台,就要考虑这种风险。这时就可以使用群组分析方法来分析放贷后,用户的还款表现。
例如某贷款产品的期限是7天,在产品发放过程的第4周开始,公司为了降低逾期率,调整了审核条件。
为了检验调整后的审核条件是否有效,需要分析审核条件变化前后用户逾期率的变化。

为此使用群组分析方法来观察逾期率随着时间发生了哪些变化。该产品的账龄分析如下表所示,表格中第一列是按每周(7天贷款期限)的还款日期分组,例如W1是“第1周的贷款”,W2是“第2周的贷款”。每一行是这一组用户贷款到期后的第几天,例如“1”表示的是贷款到期后的第一天,以此类推。
image.png
单元格里的数据是逾期率,也就是当前天数未还款的用户的占比。例如W1(第1周)贷款到期后的第1天对应的数据是31%,表示逾期率是31%,也就是第1周放款的用户当中,在逾期1天时仍未归还的用户占31%。
表的制作时间是第8周贷款到期后的第2天,而此时我们还无法获取第2天及后续的数据,因此W8这一行只有一个数据。同理,此时第7周也只有8天的数据,剩余数据暂时还无法获取。

从表中可以获得哪些信息呢?首先,看W2和W3第1天对应的逾期率分别是36.3%和39.5%,而这一列其余的逾期率几乎都是31%左右。
image.png
通过比较不同组的数据,发现相对于W1而言,W2和W3的第1天逾期率明显地升高了。随后产品调整了风控策略,W4的逾期率下降为31.2%,恢复到了正常水平。
其次,观察表的右半部分,表中从W2到W7的第8天逾期率。从W2到W7,整体呈现下降趋势,从22.3%下降到了16.4%,从第4周开始,用户逾期8天的占比有明显下降。
image.png
不仅仅是第8天,对第8天以后每周的逾期率进行分析,也可以得出这一结论。
这说明在调整了风控策略以后,不仅到期后第1天逾期率有所下降,后续天数的逾期率同样也有所下降。

通过上述分析,可以得出结论:在调整风控策略后用户逾期率有了显著的下降,这证明了风控策略的调整是有效的。

2.8.3 注意事项

使用群组分析方法需要注意如何分组,除了按时间分组,还可以根据具体的业务场景来确定。例如,上述第1个视频平台案例里,是根据用户注册月份分组;在第2个推特案例里,是根据某个月用户使用产品的天数来分组;在第3个金融行业逾期分析案例里,是根据贷款到期日分组。

2.8.4 总结

image.png

第1个问题:是什么?
“群组分析方法”是按某个特征,将数据分为不同的组,然后比较各组的数据。

第2个问题:有什么用?
群组分析方法常用来分析用户留存率(流失率)随时间发生了哪些变化,然后找出用户留下或者离开的原因。在金融行业,群组分析方法还可以用于用户逾期分析。

第3个问题:如何用?
先使用群组分析方法,找到留存率低或留存率高的组;然后使用假设检验、相关分析等方法,研究为什么这些组留存率低或留存率高。找到原因以后,就可以对应地优化产品。当群组分析表格里的数据比较多的时候,直接分析起来比较困难,这时可以把数据绘制成折线图,这样就可以很容易地发现数据发现了哪些变化。

第4个问题:注意事项。
使用群组分析方法需要注意如何分组,除了按时间分组,还可以根据具体的业务场景来确定。

2.9 RFM分析法

2.9.1 RFM分析方法是什么?

RFM是3个指标的缩写:最近1次消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary)。通过这3个指标对用户分类的方法称为RFM分析方法。
image.png
这3个指标针对的业务不同,定义也不同,要根据业务来灵活定义。各指标特征如下:
· 对于最近1次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高
· 对于消费频率(F),购买频率越高,也就是F的值越大,用户价值越高
· 对于消费金额(M),消费金额越高,也就是M的值越大,用户价值越高

把这3个指标按价值从低到高排序,并把这3个指标作为坐标轴,就可以把空间分为8部分,对下图的8类用户。
image.png

把图里对应不同RFM值的用户,总结到下表里,就得到了用户分类的规则。
image.png

2.9.2 RFM分析方法有什么用?

例如店铺某个月收入大幅下跌,通过分析,发现原来店铺几个重要的用户被竞争对手挖走了,而这几个用户贡献了店铺80%的收入。
出现这个问题,是因为该店铺没有对用户分类,对全部用户采取的都是一样的运营决策。

怎么对用户分类,识别出有价值的用户呢?
这时候就可以用RFM分析方法把用户分为8类,对不同价值的用户使用不同的运营决策,把公司有限的资源发挥到最大的效果,这就是我们常常听到的精细化运营。例如第1类是重要价值用户,这类用户最近一次消费时间较近,消费频率也高,消费金额也高,要提供VIP服务。
image.png

日常生活中接触到的会员服务就是这方面的经典案例,按会员等级提供不同的服务。根据企鹅智库《2017中国会员经济数据报告》显示,用户对信用卡、酒店、航空公司的会员体系最满意。
image.png

2.9.3 如何使用RFM分析方法?

前面提到RFM分析方法可以把用户分为8类,具体是如何做到的呢?

第1步:计算R、F、M的值。
要得到R、F、M这3个指标,一般需要数据的3个字段:用户ID或者用户名称、消费时间、消费金额。从这3个字段可以计算出R、F、M这3个指标。
以下图中的原始数据为例,假设现在是2020年1月30日,分析最近30天的用户。其中,小明最近一次消费是2020年1月26日,与今天(1月30日)的间隔是4天。他在最近30天消费了2次,总共消费金额是5000元。
image.png
用这个方法,计算出下表里两位用户的R、F、M值。同时在表格里加了3列,用于后面对计算出的R、F、M 3个值打分。
image.png

第2步:给R、F、M值按价值打分。
注意这里是按指标的价值打分,不是按指标数值大小打分。对于最近1次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高。

image.png

将R、F、M 3个指标分别按价值从小到大分为1~5分。
这个案例里,对于最近1次消费时间间隔(R),大于20天的打1分,10~20天的打2分,5~10天的打3分,3~5天的打4分,3天以内打5分。
把这3个指标的打分规则,整理到前面的表里。实际业务中,如何定义打分的范围,要根据具体的业务来灵活掌握,没有统一的标准
image.png

根据打分规则,可以对表2-16计算出的R、F、M值进行分类,在最后3列填上对应的分值,如下所示。
image.png

第3步:计算价值平均值。
分别计算出R值打分、F值打分、M值打分这3列的平均值。
image.png

第4步:用户分类。
在表格里增加3列,分别用于记录R、F、M 3个值是高于平均值,还是低于平均值。如果一行里的R值打分大于平均值,就在R值高低列里记录为“高”,否则记录为“低”。F值、M值也这样比较,最终得到了下表里的值。
image.png

然后和用户分类表格里定义的规则进行比较,就可以得出用户属于哪种类别。
image.png

总结下前面的内容,用RFM对用户分类的过程如下:
(1)使用原始数据计算出R、F、M值;
(2)给R、F、M值按价值打分,例如按价值从低到高分为1~5分;
(3)计算价值的平均值,如果某个指标的得分比价值的平均值低,标记为“低”。如果某个指标的得分比价值的平均值高,标记为“高”;
(4)和用户分类规则表比较,得出用户分类。
image.png
现在再回过头看前面这个分类图,你就会恍然大悟:坐标轴的中心,可以理解为某个指标价值的平均值。
image.png

用户分类后,如何精细化运营呢?由于不同公司业务不一样,运营策略也不一样。这里举例说明前4类用户供参考:
image.png
(1)重要价值用户,RFM三个值都很高,要提供VIP服务;
(2)重要发展用户,消费频率低,但是其他两个值很高,要想办法提高他的消费频率;
(3)重要保持用户,最近消费时间距离现在较远,也就是R值低,但是消费频率和消费金额高。这种用户,是一段时间没来的忠实客户。应该主动和客户保持联系,提高复购率;
(4)重要挽留客户,最近消费时间距离现在较远,消费频率低,但消费金额高。这种用户即将流失,要主动联系用户,调查清楚哪里出了问题,并想办法挽回。

这样通过RFM分析方法来分析用户,可以对用户进行精细化运营,不断将用户转化为重要价值用户。

2.9.4 注意事项

(1)R、F、M指标在不同业务下定义不同,要根据具体业务灵活应用。
举个例子,你现在是滴滴打车的一名运营人员,如果用RFM分析方法对用户进行分类,你会如何定义R、F、M这3个指标呢?对应这里的业务,R可以定义为“上一次打车距离现在多少天”;F可以定义为“过去30天的打车次数”;M可以定义为“过去30天内打车的总金额”。为什么F不是“历史打车总数”呢?因为滴滴打车满足的是用户高频的短途出行需求,如果用户连续一个月未使用,即可定义为流失用户,所以“一段时间”可以定义为“最近30天”。如果是滴滴的代驾或者货车业务,是低频的需求,可以把“一段时间”定义为“一年或者1个季度”。

(2)R、F、M按价值如何确定打分的规则。分值一般分为1~5分,也可以根据具体业务灵活调整。每个分值的范围要根据具体业务来定,就好比你在开车,车速控制在哪个范围,可以根据路况灵活把握。
此外,FRM打分的规则可以与业务部门沟通,进行头脑风暴。或者使用聚类的方法对R、F、M的值进行分类,然后给每个类别打分。

(3)R、F、M这三个指标可以灵活和其他分析方法结合使用。
例如,某个店铺做活动以后,希望对老用户的表现做复盘总结。可以使用对比分析方法来比较该店铺今年和去年同样活动中老用户的复购情况。
可以使用R值来衡量老用户的复购情况。R值定义为老用户最后一次消费时间间隔,这样R值可以反映老用户的活跃程度和复购周期。可以简单理解为R值越小,用户越活跃、复购周期越短。下表是老用户今年和去年活动的R值分布。
image.png

为了方便观察数据,把表中的数据进行可视化。如下图,图中的柱形图对应的数据是表格中的去年人数和今年人数,折线对应的数据是表格中的人数同比。从图中可以看出,折线的两个低点分别是90image.png

引起“老用户复购下降”的主要区间在折线的低点90image.png
除了90<R≤180区间复购人数下降显著,还可以看下是否有其他相对显著的变化,发现360<R≤720的复购提升最明显。对比分析后,将问题缩小到两类用户:90<R≤180和360<R≤720区间的老用户,接着就可以深入分析这两类用户了。

2.9.5 总结

image.png
第1个问题:是什么?
RFM是3个指标的缩写:最近一次消费的时间间隔(R)、消费频率(F)、消费金额(M)。

第2个问题:有什么用?
通过RFM分析方法可以把用户分为8类,这样就可以对不同用户使用不同的营销策略,例如信用卡的会员服务。

第3个问题:如何用?
可以回顾案例中用RFM分析方法对用户分类的过程。现在有很多工具如Excel、SQL、Python等都可以实现RFM。工作里用到的时候,可以搜索对应的实现工具,就可以快速实现了。

第4个问题:注意事项。
(1)不同业务中R、F、M的定义不同,要根据具体业务灵活应用。
(2)R、F、M按价值确定打分的规则一般分为1~5分,也可以根据具体业务灵活调整。

2.10 AARRR分析法

Pirate Metrics,即海盗指标法。
海盗模型里面的AARRR任何一个节点,都可以相互作用。并且,根据不同的业务类型和业务场景,各个环节的重点可以相互调换甚至取舍。

获取:自然流量、直通车、淘客
激活:优惠券、红包
留存:收藏送优惠券
营收:邀请下单优惠
传播:转发拼单
《数据分析思维》学习笔记 - 图89

《数据分析思维》学习笔记 - 图90

2.10.1 什么是AARRR模型分析方法?

AARRR模型对应产品运营的5个重要环节,分别是:
(1)获取用户(Acquisition):用户如何找到我们?
(2)激活用户(Activation):用户的首次体验如何?
(3)提高留存(Retention):用户会回来吗?
(4)增加收入(Revenue):如何赚到更多钱?
(5)推荐(Referral):用户会告诉其他人吗?

如果把产品看作一个鱼塘,使用产品的用户看作鱼塘里的鱼,AARRR模型的5个环节可以描述如下:
(1)获取用户:想办法给鱼塘里添加新的鱼,从而扩大鱼塘的规模;
(2)激活用户:让鱼塘里的鱼喜欢上这里的环境;
(3)提高留存:随着时间的推移,一部分鱼觉得鱼塘没意思,就离开跑到其他鱼塘里了,这些鱼就是流失用户;留下来的鱼就是留存用户。所以要想办法把用户留住;
(4)增加收入:鱼塘有盈利模式才能活下去,所以要想办法赚到更多钱;
(5)推荐:让更多的人知道这个鱼塘,才能扩大鱼塘的规模。对应产品,就是让用户推荐给其他人,才能让产品有更多新用户。
image.png

2.10.2 AARRR模型分析方法有什么用?

因为AARRR模型涉及用户使用产品的整个流程,所以它可以帮助分析用户行为,为产品运营制定决策,从而实现用户增长。例如,使用其他分析方法定位到问题的原因是留存率低,那么就可以参考AARRR模型里留存这一环节的策略来提高留存率。

2.10.3 AARRR模型分析方法如何使用?有哪些注意事项?

接下来,分别看下AARRR模型的每一个环节如何使用,以及有哪些注意事项。

1.获取用户:用户如何找到我们?
在“获取用户”这一环节,需要关注以下指标:
(1)渠道曝光量:有多少人看到产品推广的信息;
(2)渠道转换率:有多少人因为看到广告转换成用户;
(3)日新增用户数:每天新增用户是多少;
(4)日应用下载量:每天有多少用户下载了产品;
(5)获客成本:获取一个客户所花费的成本。

在互联网行业中,很多创业公司死掉并不是因为它们的业务或产品不行,而是因为它们的获客成本很高,并且没有办法降下来。
肖恩最初是在硅谷的Dropbox公司工作,这是一家做云存储业务的创业公司。这家公司开始时每获得一名用户的成本高达400美元,而它提供的付费服务每年是99美元。肖恩对低成本获客提供了两个建议:一是语言,二是渠道

1)语言
语言就是指怎么说才能打动用户的心,例如广告的文案。2001年iPod问世时,广告语是“将1000首歌放在你的口袋里”,这么一句话就让用户知道了这个产品的魅力所在。(公司slogan?)
image.png

2)渠道
渠道是指产品投放在什么地方才能让用户看到。主要有四类渠道:搜索引擎、应用市场、付费渠道、口碑渠道。
(1)搜索引擎是指通过搜索引擎来提高产品在搜索结果页面的排名。
(2)应用市场是给手机安装各类App的平台。安卓系统下的应用市场可以分为两类:一类是手机厂商自营的应用商店,另一类是一些大型互联网公司或者第三方平台开发的应用市场。目前主流的应用市场如下。
image.png
(3)付费渠道在第1章里已经写过,包括展示位广告、搜索广告和信息流广告。这里以应用市场为例来介绍付费渠道。
付费推广后,App在安卓应用市场内的排名会有所提升。应用市场常见的推广位置有总榜排名、专题页、分类页和推荐页。
image.png
苹果App Store的推广方式与安卓应用市场有所区别。国内比较主流的推广方式是应用商店优化(ASO,App Store Optimization)。通过对App的名称、关键字、描述、评价和下载量进行优化,来提升App的搜索排名,从而获得大量的下载。
(4)口碑渠道是用户主动把产品推荐给周围的人。例如,特斯拉几乎不在广告上花钱,因为车主会主动推荐给周围的朋友。2019年《彭博商业周刊》针对5000位特斯拉Model 3车主进行了一次用户调研,有99%的车主表示会把Model 3推荐给家人和朋友,这是一个非常惊人的推荐率。

不管是以哪种渠道推广来获取用户,本质上都是提高产品出现在用户面前的概率。例如,特斯拉的Model X的“鹰翼门”就是为了提高产品出现在用户面前的概率而设计的。在社交网络上,疯传着很多Model X的图片,这让更多人看到了特斯拉的这个产品。

获取用户时,需要注意降低用户参与的门槛。有的App好不容易把用户吸引过来,但是整个注册过程超级烦琐,用户一看太麻烦就跑了。社交软件WhatsApp(类似国内的微信)被facebook以190亿美元收购。WhatsApp将所有精力都用在了如何让自己的产品更加简单易用,不需要创建用户名或密码就能使用。由于它的简单易用,WhatsApp的口碑传播非常好。

2.激活用户:用户的首次体验如何?
很多产品注册用户不少,但是打开率却不高。这一环节要做的是激活他们,让用户真正地使用产品。这就需要先弄明白产品的“啊哈时刻”。什么叫“啊哈时刻”呢?就是用户情不自禁地喜欢上产品亮点、发出赞叹的时刻。例如,网易云音乐在众多音乐软件中突围的亮点就是评论。用户打开软件,可能第一件事不是听歌,而是看评论。(亮点?)
要想激活用户,需要绘制一幅通往“啊哈时刻”的路径图。例如你负责的产品是个购物软件,在新用户体验到“啊哈时刻”之前,必须要完成这些步骤:下载App、注册账户、找到所需商品、放入购物车、填写邮寄地址、付款。在上述一系列环节中,到底用户停留在了哪一步,不再愿意继续下去?是搜不到想要的东西,还是创建账户太麻烦?可以计算每个节点用户的转化率(也就是完成每个步骤的用户比例),看用户是在哪个阶段流失的,以此来优化产品,改提高用户体验。

所以,激活用户需要关注“啊哈时刻”和活跃率指标

下面来看一个关于用户激活的经典案例:拼多多如何激活用户?
许多电商App在使用过程中有着多余的跳转,导致用户最终放弃了支付。用户在淘宝上通过搜索商品来购物的流程有6个环节,通过浏览商品来购物的流程有7个环节。拼多多为了减少购物环节,从进入首页到支付只有4个环节。拼多多是如何做到的呢?它通过4大方法将购物变得简单:
(1)首页直接推荐产品,不放无效信息,不需要用户点击多次才到达商品页面;
(2)没有设置购物车,一件产品直接购买支付,减少了用户犹豫的时间;
(3)所有商品都包邮,用户不需要和客服沟通是否包邮;
(4)先付款后拼团,将支付环节提前,这样可以让用户提前用团购价完成支付,随后再找人拼团,拼成功了就发货,不成功就退款。
(削减购物环节,减少了用户犹豫的时间,促进下单?)

激活用户还可以通过游戏的玩法,给用户发放奖励来唤醒用户,例如打卡、积分、发优惠券等。拼多多的拼团玩法就很好地激活了用户,在各种群里都可以看到用户在拼团、砍价。

3.留存:用户会回来吗?
用户被激活之后,第三个环节就是如何让用户变成回头客留存下来。留存的核心目标是让用户养成使用习惯。这一环节需要关注留存率指标

如果产品留存率低怎么分析原因呢?
可以用群组分析方法来找到原因。下面来看几个经典案例。
亚马逊刚推出会员服务时,许多人说这个计划必定会失败,因为美国的配送成本很高,而以99美元的会员费给会员免费配送一年,亚马逊肯定会亏。但亚马逊的真正目标是改变人们的习惯,让用户在购物中习惯会员优惠价格,习惯免运费,从而不再去其他商家买东西,进而提高了用户留存。
蚂蚁森林是阿里巴巴推出的一款在支付宝里的游戏,用户可以到其他用户的页面上去偷取能量,当能量累计到一定程度,就可以申请种一棵树。蚂蚁森林会在现实中种一棵树,并为用户发一个植树的证书。截至2020年3月12日,蚂蚁森林的用户数超过5.5亿,累计种下1.22亿棵真树,成功提升了支付宝的用户黏性,提高了留存。
(改变习惯,形成依赖?)

4.增加收入:如何赚到更多钱?
这一环节的目标是如何赚到更多钱。收入分为服务收入、广告收入。服务收入是指产品里的付费服务,例如网易音乐的会员服务,用户开通会员才能听某些歌曲。广告收入是指依靠投放在产品里的广告而获取的收入,例如公众号发推广文案就可以带来广告收入。这一环节需要关注以下指标:
(1)用来衡量业务总量的指标,例如成交总额、成交数量;
(2)用来衡量每个人平均情况的指标,例如客单价;
(3)用来衡量付费情况的指标,例如付费率,复购率。

这一环节有个概念需要重视,那就是“夹点”,它指的是损失潜在收益的地方。例如电商购物中,用户从选择商品到支付之间,很多人会中途放弃付费。要评估这些常见的夹点,分析用户在这些关键环节放弃的原因。
有段时间facebook发现用户流失比较严重得。之前用户注销账号的确认页面有一段提示:“你确定要注销吗?”如果用户点击“确认”按钮,就注销了。后来facebook改变了确认流程,在注销结束之前增加了一个页面,在上面把跟你互动比较紧密的五个朋友的头像列出来,然后配上文字:“你确定要注销吗?”潜台词就是,你如果要注销的话,你的朋友可就再也看不到你了,你再考虑一下?就是这个页面给facebook增加了3%的留存率。

5.推荐:用户会告诉其他人吗?
前面的4个环节做完,就到了第5个环节—推荐,也叫病毒营销或者自传播。美国作家马尔科姆·格拉德威尔在《引爆点》这本书中用流行病来类比营销:引爆一种流行病需要三个条件—传染物本身、传染物发挥作用所需的环境、人们传播传染物的行为。
1)传染物本身
传染物本身是说要对自己的产品有足够的了解。试着问自己一个问题:我的产品是否真正解决了用户的痛点?如果你是写文章的,就要考虑你的文章能为用户带来哪些真正的价值;如果你是做餐饮的,则要考虑你的菜品是否真的为用户所喜欢。

2)传染物发挥作用所需的环境
传染物发挥作用所需的环境,也就是指用户所在的环境,对应前面讲的AARRR模型的第一环节“获取用户”。要思考使用产品的用户经常在哪些环境(如社区、大学等)出现。

3)人们传播传染物的行为
在对自己的产品有了深刻洞察,同时找了目标用户后,还要考虑人们会因为什么目的去分享你的产品,让更多的人看到你的产品。这个条件对应的就是AARRR模型的第五个环节—推荐,即病毒式营销。

这一环节需要关注的指标有转发率、转化率、K因子

来看几个这一环节的经典案例。
许多健身App鼓励用户将运动轨迹分享到微信朋友圈来打卡,从而实现用户的自传播。如果没有这种自传播,产品的信息流就会中断,无法实现自增长。
image.png
就好比你在朋友圈转发了一篇自己写的文章,与此同时,有10个朋友看到了这篇文章,但是都没有进一步去转发到他们各自的朋友圈,那么你这篇文章的信息流到此已经中断,不会进行二次传播了。

滴滴通过红包这样的超级营销工具,实现了产品的病毒营销。滴滴红包只有分享给微信好友才能领取到,很多人为了打车省钱,会主动把红包发到群里或者朋友圈。

民宿平台爱彼迎有一个“旅行基金”的功能,当你每推荐一位好友注册爱彼迎,你和好友都可以获得礼金券,礼金券可以在下次旅行抵扣对应的金额。

特斯拉对买车用户有个车主引荐奖励计划,车主分享链接以后,通过引荐链接下单的车辆交付后,车主和被引荐的新车主将各自获得免费超级充电额度。

还有一种让用户推荐的形式,很多付费产品会有一个“参与推广”的功能,如果用户推广到朋友圈,有人购买产品,那么该用户就会获得一定比例的佣金。

需要注意的是,要坚持把每一次营销当作一种产品体验理念的实现,让用户分享的奖励不能华而不实,要能真正为消费者带来好处。同时,奖励要与产品的核心价值有关。例如,在猴子数据分析社群里,为了鼓励用户完成“闯关游戏”的关卡,会给完成每一关的人发一个红包作为奖励。但是经过分析,我发现这种奖励效果不太好,因为奖励和产品的核心价值没有关系。经过优化,奖励变成了每一关课程相关知识的案例扩展,极大地提高了用户的活跃率。

2.10.4 总结

用户不增长是创业公司做产品的魔咒。只要不增长,用户就会越来越少,例如人人网。AARRR模型可以帮助我们分析产品的用户行为,可以在不同阶段制定不同运营策略,从而实现用户增长。可以用图2-156记住AARRR模型的5个环节,然后在实际业务中灵活使用。

2.11 漏斗分析方法

关于漏斗模型,我认为本质是分解和量化。为什么这么说,这里以营销漏斗模型举栗。


百科给出的解释:营销漏斗模型指的是营销过程中,将非潜在客户逐步变为客户的转化量化模型。营销漏斗模型的价值在于量化了营销过程各个环节的效率,帮助找到薄弱环节

也就是说营销的环节指的是从获取用户到最终转化成购买这整个流程中的一个个子环节,相邻环节的转化率则就是指用数据指标来量化每一个步骤的表现。所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的,整体漏斗模型的核心思想其实可以归为分解和量化。

无独有偶,OKR的核心思想也是这个,即分解和量化。OKR(Objectives and Key Results)全称为“目标和主要成果”, OKR首先是设定一个“目标”(Objective),即大O,然后将该目标拆分为若干个子目标,即小O,最后将小O设定为若干个可以量化的“关键结果”(Key Results),用来帮助自己实现目标,即KRS。通过达成量化的KRS来实现小O,最终达成大O,可以看到整个过程中的核心关键也在于分解和量化。

这就是文章开头部分提到的,我觉得漏斗模型不仅仅只是一个模型,更是一种方法论,一种思维方式的原因。可以通过这种分解和量化的形式,将问题进行不断的拆解,最后通过量化的形式来辅助达成目标,或者针对异常的步骤进行调优,最终达到总目标。它可以广泛应用于流量监控、产品目标转化等日常数据运营工作中,称之为转化漏斗;也可以用于产品、服务销售,称之为销售漏斗。

数据分析必备:漏斗模型(附案例解析) https://www.sohu.com/a/298805579_165070

2.11.1 什么是漏斗分析方法?

从业务流程起点开始到最后目标完成的每个环节都会有用户流失,因此需要一种分析方法来衡量业务流程每一步的转化效率,漏斗分析方法就是这样的分析方法。例如,在淘宝上一款商品的浏览量是300、点击量是100、订单量是20、支付量是10,在业务流程的每一步都有用户流失。
image.png
环节转化率=本环节用户数/上一环节用户数,是为了衡量相邻业务环节的转化情况。

例如,上表中的业务流程中第1环节是浏览,第2环节是点击,那么点击环节的转化率即为100(点击用户数)/300(浏览用户数)=33%。整体转化率=某环节用户数/第1环节用户数,是为了衡量从第1环节到该环节为止总体的转化情况。
例如,上表中的业务流程中第1环节是浏览,第4环节是支付,那么支付环节的整体转化率为10(支付用户数)/300(浏览用户数)=3%。

把表格做成下图的形式,就是常见的漏斗分析图。因为它的形状像漏斗,所以叫作“漏斗图”。
image.png

再例如下图,是“猴子·数据分析学院”中“求职秘籍”课程在2020年2月份的漏斗图。
image.png

2.11.2 漏斗分析方法有什么用?

漏斗分析的作用是“定位问题节点”,即找到出问题的业务环节在哪。漏斗分析常用于用户转化分析或者用户流失分析,所以漏斗分析中要关注两个指标:用户转化率和用户流失率

经过各个业务环节转化下来的用户,会产生更大的价值。因为这部分用户更加忠诚,更认可业务的流程。随着转化用户的不断增加,留存用户的规模也在不断增大,产品的盈利规模也会随之增加。

流失的用户数量在每个业务环节都不同。可以分析用户主要流失在哪个业务环节,以及为什么流失,是因为业务流程过于复杂,还是产品特性无法完全展现,或是其他原因,最终的目的都是不断减少用户流失率。

2.11.3 如何使用漏斗分析方法?

以汽车行业为例,可以将业务流程分为三部分:售前、售中、售后。
image.png

将汽车行业业务流程中的指标与漏斗分析结合,可以得到环节转化率和整体转化率
image.png

漏斗分析的整体转化率,是从整体上评估各环节用户占初始环节用户的比例,这样就可以根据一定的比例,去预测未来的大致转化或者流失情况。例如,未来一个月线索达到4000,那么根据目前这个数值(线索-签约转化率为13%),可以大致估算出最后的签约量应该在4000×13%=520左右。

漏斗分析的环节转化率可以评估各业务环节之间的转化情况,通过比较各环节转化率,从而寻找业务瓶颈点,也就是找到最低转化率对应的业务环节。在上面案例中,环节转化率最低的为“线索-进件”(转化率为25%)。

为什么“线索-进件”的环节转化率最低呢?
毕竟将单纯的用户(线索)发展到愿意进行信审评估(进件),是件很不容易的事,但是这个点是否就是急需解决和优化的流程呢?这就需要使用对比分析方法和行业平均值来比较。如果行业平均值为19%,那么这里的25%已经超出行业均值6个百分点了,不应作为最急需解决的点,而应着眼后续流程,即寻找后面的转化薄弱点。如果无法得知行业内平均值,可以与本公司历史转化率进行比较,找出表现最差的业务环节,对症下药,持续优化。对于不同的场景,可以灵活运用漏斗分析。

下面再来看一个案例。某线上店铺本周的销量降低严重,从上周的1000单掉到了680单,那么是中间哪个业务环节出了问题?如何改善这种情况?这需要向前探索,去分析用户从浏览商品到最后下单需要经历的步骤是什么,再看这些步骤中,哪一个是薄弱环节,影响了订单的整体转化率。
该案例的业务流程是:浏览商品、点击商品、加购物车、提交订单、支付订单。业务流程确定后,使用对比分析方法将本周和上周的数据进行比较,然后用漏斗分析方法来分析,算出各周的环节转化率。
image.png
在两周数据的对比分析中,可以发现“点击-加购”的环节转化率明显降低(从20%降为13%),这意味着用户点击商品后,却不愿意将商品加入购物车。与业务人员沟通后发现,店铺在本周更换了商品的介绍页,用户看到本期的商品介绍后,加购的意愿却降低了,导致最后订单量降低。找到原因后,就可以针对性地对商品介绍页进行调优和改善,例如与上期的介绍页结构保持一致,色彩优化等,从而提升运营效率和转化率。

2.11.4 注意事项

使用漏斗分析方法来分析用户转化问题时,不同行业的业务流程不一样,所以漏斗分析图也不一样。如果把漏斗分析方法原封不动地带入某个行业,不去结合所在行业的业务特点,那么分析出的结果很难具有业务指导性。
例如,传统的漏斗图是以AARRR模型为基础,即获客、留存、活跃、变现、推荐,这是以用户增长为核心的漏斗图。但是对于非社区类产品,例如低频且成交周期长的购车场景而言,传统的AARRR模型无法真正表达出汽车行业的业务需求。将漏斗分析方法和购车的业务流程结合起来,这就形成了线索、进件、过审、签约、交车的漏斗图。所以,漏斗分析方法要结合行业进行调整,才可以产生指导作用。

3. 电商业务知识

image.png
image.png

随着电商的普及,新用户不再是无穷无尽的了,用户变得更加挑剔,更有个性。电商行业不得不从“流量运营”转变为“精细化用户运营”。具体表现是不再满足“店铺访客×购买转化率”的一锤子买卖,而是重视促成单个用户的多次交易以及老用户带动新用户的社交裂变,这些转变标志着电商行业由“流量运营”升级为“用户运营”

用户运营在电商行业越来越重要,有以下几个原因。
一是流量下滑。
二是由于市场下沉,小城市用户需要新的洞察。
三是电商行业重视打造“会员”概念,培养核心用户。

image.png

每位消费者在电商平台中都有一个专属的ID被记录行为。这反映了电商在数据上首先区别于传统零售的优势:
(1)电商数据是大数据,监控途径很广,从浏览到下单都是有迹可循的;
(2)用户特征上带有预测性,性别和年龄都是根据历史行为被预测,例如一个只浏览女性类目的男孩子,在电商的世界里很可能会被定义为“女”;
(3)能够更新,例如收货后再退货,订单状态会由“交易成功”改为“交易关闭”。

image.png