磊叔_知乎:https://www.zhihu.com/question/284174976/answer/530011502

很多做数据的小伙伴,经常给磊叔微信说有时候面对密密麻麻的报表时,一时半会找不到头绪,很着急。其中不仅有初入行的新鲜人,甚至还有多年经验的数据老手,他们都会有不同程度的困惑。 授人予鱼不如授人予渔。 缺失数据分析思路的本质是缺失了一套合理和科学的分析方法和流程。磊叔特别总结了七种利器,偷师于阿里管理体系,同谓之“七剑”:

  1. 观察数据的表征:描述性统计
  2. 我是青蛙:观察变化
  3. 一个方块六个面:多维分析
  4. 两手都要抓:交叉分析
  5. 找到关键先生:相关性分析
  6. 回到未来:趋势预测
  7. 分析的实相:回归业务

磊叔的故事从星巴克开始:

最近运营小伙伴上了星巴克买一送一的活动,一是希望提升APP的注册用户数,二是希望提升APP的消费习惯,三是希望提升APP的活跃和留存。用户使用也简单,每个周五到星巴克店内,消费时出示一下APP上的二维码就行了。反正就是想通过星巴克的品牌影响力和传播力,借势把APP整体的数据都提升一下。
实际效果呢,星巴克店内确实热热闹闹的,基本上来买咖啡的人都在问买一送一的事情。当然,指标上表现也很漂亮。
看上去皆大欢喜。
且慢!
你作为一个负责任的数据人,又怎么止步于亮眼的表象呢?于是乎,你拿出“七剑”,面对星巴克买一送一活动上报的各类报表,开始了寻觅真相之旅。
一套科学的数据分析方法 - 图1一套科学的数据分析方法 - 图2星巴克买一送一的报表

1)观察数据的表征:描述性统计

大眼扫一下数据,映入眼帘的就是:“呦,星巴克的数据很高挑啊!”。
单看支付入口的UV,平时最低是5000,平时最高7000,波峰和波谷距离2000,平均值在6000左右,而且集中在6200上下。星巴克一来,UV直接飙到100000,最差也有80000。
做的好!你刚刚完成了一次支付入口UV的基本情况的分析,官方名称叫:描述性统计。 描述性统计,是观察样本基本情况的一种方法。通常考察样本的平均数、中位数(以及四分位数)、众数、几何平均数、调和平均数、方差、标准差、分布等。目的是从表象和整体观察样本的特征。 一套科学的数据分析方法 - 图3一套科学的数据分析方法 - 图4描述性统计时,你的眼睛看到的报表可能长这个样子

一套科学的数据分析方法 - 图5一套科学的数据分析方法 - 图6也可能长这个样子一套科学的数据分析方法 - 图7一套科学的数据分析方法 - 图8还有可能长这个样子
在对其他指标进行描述性统计后,你得到了第1条事实:星巴克的效果确实明显!

2)我是青蛙:观察变化

星巴克的效果确实明显!
你作为一个负责任的数据人,又怎么止步于效果明显的整体表现呢?自然会问:
如何评估效果明显?有多明显?如何量化?
效果明显的直观理解就是指标发生了变化,即需要考察指标变化的程度。
单说支付入口UV,平日对比前日的变化有涨有跌,集中在 -7.6% ~+24.1%,星巴克同比上周却不断下降,降幅最高可达-11%。
Good Job!你拥有了一双蛙眼的能力,不仅将效果明显通过量化指标体现出来,还给出了更客观的变化对比。 青蛙,其特殊的眼睛构造使得只能分辨动态的物体,而对静止的事物却不产生神经脉冲,即只能看见运动的物体,看不到静止的物体。 在对其他指标分析变化后,你得到了第2条事实:星巴克对比平日涨幅10几倍,但同比呈下降趋势!是否效果在逐步减弱?
一套科学的数据分析方法 - 图9一套科学的数据分析方法 - 图10你变成青蛙时,你的眼睛看到的报表长这个样子

3)一个方块六个面:多维分析

星巴克效果明显,但是同比却在不断下降,你很自然会问:
这是为什么呢?只看同比还是有点单薄和局限,是否有其他更多的角度去看呢?
毕竟,一个方块有六个面,我们需要从更多的角度去深入分析。
你作为一个负责任的数据人,需要一个强有力的武器来帮你,这就是:维度表,维表的名字可能大众更熟悉,而且是和支付入口UV相关的维度,于是:

  • 从品类来看,美式的占比表现稳定,占比变化不大
  • 从杯型来看,大杯的占比表现稳定,占比变化不大
  • 从城市来看,广州的占比下降明显,其他城市变化不大
  • 从时间场景来看,青年人下降明显,其他年龄层用户变化不大 多维分析,即多维度分析,指通过多种具有共同性质的数据进行分析,是指标体系和指标的重要组成部分。也许你更熟悉“数据立方体”这个更互联网化的名字。耳熟能详的“下钻”,即是维度的下钻。 一套科学的数据分析方法 - 图11一套科学的数据分析方法 - 图12星巴克买一送一的相关维度
    通过多个维度去分析后,你得到了第3条事实:星巴克同比呈下降趋势,其中广州和青年人(18~30)的消费占比下降明显。

    4)两手都要抓:交叉分析

    星巴克效果明显,但是同比下降,广州和青年人占比下降明显。你自然会问,除了支付入口UV,其他指标的情况呢?相互之间是否有什么关系吗?
    你作为一个负责任的数据人,需要多个指标结合在一起做更深入的分析,即交叉分析。
    这个时候不能单看一个指标了,你加上了支付入口ctr,同支付入口UV进行交叉分析。
    支付入口UV在星巴克活动的时候涨的很厉害,但是支付入口的ctr基本稳定在10%上下,最低9.2%,最高10.5%,幅度在-0.8%~+0.5%,甚至星巴克的时候还出现比平时更低的情况。
    因为ctr是百分比指标,故ctr变化不大的可能原因即分子和分母同步增长,是否可以认为新增的流量基本都来星巴克买一送一,即星巴克活动带来的新增流量全都进入了星巴克,而未给其他板块带来收益呢?
    一套科学的数据分析方法 - 图13一套科学的数据分析方法 - 图14
    通过交叉分析,你得到了第4条事实:支付入口UV和支付入口ctr交叉分析后发现,ctr几乎没有变化,暴涨的流量难道都是来消费星巴克的吗?UV和ctr是否真的如数据所示毫无关系吗?

    5)找到关键先生:相关性分析

    是的,支付入口的UV和支付入口的ctr,看上去似乎没有任何联系,你涨你的,我维持惯性不变。你自然会问:这两个指标是否真的看上去毫无影响和关系吗?如果有关系,怎么衡量他们之间的关系和影响程度呢?
    你作为一个负责任的数据人,开始量化两个指标之间的关系,即相关性分析。 相关性分析,指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。 一套科学的数据分析方法 - 图15一套科学的数据分析方法 - 图16
    通过相关性分析,你得到了第5条事实:支付入口UV和支付入口的ctr存在微弱的联系,从业务层面来看,可以认为两者互不相关。

    6)回到未来:趋势预测

    呼呼啦啦的分析了这么多,基本上把能拿到的数据分析的七七八八了。面对这些历史数据,你自然也会问:后续情况会怎样发展呢?
    你作为一个负责任的数据人,在分析历史数据的基础上着手了趋势预测,看一看未来可能的发展趋势。 预测分析是一种统计或数据挖掘解决方案,包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。 一套科学的数据分析方法 - 图17一套科学的数据分析方法 - 图18季节性预测结果
    通过预测分析,你得到了第6条事实:支付入口UV未来逐步降低维持在25000上下。

    7)分析的实相:落地业务

    如果就到此结束,那么就是只有一只脚跨进数据分析的大门。数据分析的目的和结果是要落地到业务,能够实打实的在业务层面上产生效果。
    你作为一个负责任的数据人,带着数据告诉我们的所有分析结果和困惑和业务同学沟通,尽可能的找到造成这些问题的原因。
    最后,结合“七剑”的分析思路和结果,你写下了可谓字字珠玑的星巴克买一送一活动分析结论和建议:

星巴克的效果确实明显!支付入口流量对比平日涨幅10几倍,但同比呈下降趋势,其中广州和青年人(18~30)的消费占比下降明显。
出现以上情况的原因可能是因为有其他活动占了星巴克的曝光位,导致星巴克活动的流量下降,同时,入口流量和入口ctr呈弱关联,可能由于星巴克的客群相对稳定和固定,故流量下降时星巴克的支付入口位转化率保持稳定。
支付入口UV未来逐步降低,并维持在25000上下。