From:https://www.yuque.com/hanxiaoxiannv/sk3m32/grvnyh#mCJGG
今天来讲数据分析的第四篇文章数据呈现之数据分析方法,是整个数据分析篇章中最后一部分内容。(从去年11月份写到现在,可算是写完了)
在前面第二篇、第三篇文章中,我们讲了数据生成-获取数据-数据建模-数据指标搭建这样漫长的数据加工处理过程,到最后一步便是数据呈现和从数据中挖掘出来的问题或者机会点的数据应用。
有句话调侃讲,辛苦干活儿一年还比不过一个做PPT的。同样适用数据分析,如果前面做了大量数据加工处理工作,但是最后不会做数据分析和数据呈现,挖掘不到问题和机会点,那么前面的工作将白费。(或者说前面的工作皆属于打地基,最后一步也就是本篇文章讲述的内容是收获果实。)
通过数据呈现,把分析的结果完整呈现出来,为决策者提供科学、严谨的决策依据,供决策者参考以做出决策。
好的数据呈现,需要有一个好的方式展现数据间的关系和规律,让人一目了然,这是接下来要说的数据分析方法论。常见的漏斗分析、多维拆解、趋势分析、对比分析、帕累托分析和交叉分析等。
上篇讲的数据指标搭建是从宏观层面指导如何进行数据分析,本章讲的数据分析法主要从微观角度指导如何进行数据分析。从宏观到微观是不断细化的过程。
1、漏斗分析
漏斗分析能够科学反映用户行为状态,以及从起点到终点各业务流程的用户转化率情况,是一种重要的流程式数据分析方法。
比如:对于电商产品来说,最终目的是让用户购买商品,但整个流程的转化率由每一步的转化率综合而定。这时,我们就可以通过漏斗分析模型进行监测。
如下图所示,我们可以观察用户在每一个环节上的转化率,寻找转化路径的薄弱点,优化产品,提升用户体验,最终提升整体的转化率。

所有互联网产品、数据分析都离不开漏斗,无论是注册转化漏斗,还是电商下单漏斗。需要关注两点,第一是关注哪一步流失最多;第二是关注流失的人都有哪些行为。转化率最低的环节,往往是ROI 价值最大的地方。
2、多维拆解
我自己本身是做支付业务的,日常呈现数据最多的形式便是多维拆解。(多维的意思是从多个维度拆解度量指标,如果对维度和度量不太了解的可以去看我之前的文章数据分析 | 数据分析整体框架(二))
首先呈现整体支付成功率,其次按照商户维度分别去看各商户支付成功率;每个商户下有很多个国家,再按照国家维度去看支付成功率;每个国家有很多个支付端,再按照各个端维度去看支付成功率;每个端上有很多个支付方式,再按照各支付方式维度去看支付成功率。至此,拆到最小颗粒度。
在分析数据时,若整体支付成功率发生异常,按照此路径拆解到最小颗粒度的支付方式,基本可以锁定发生问题的原因。

3、趋势分析
建立趋势图表可以迅速了解市场、用户或者产品特征的基本表现,便于进行迅速迭代。趋势分析通常按时间维度的小时\天\周\月 看度量指标的变化情况(像我每天早上来第一件事是看昨天的支付成功率有无异常)。
趋势分析有两大作用:趋势预测和数据监测。比如我现在正在做的项目业务数据监控,就是基于支付成功率在过去一段时间内的数据表现来预判当前支付成功率是否异常。如下图中的7月和8月明显低于其他月份,可判定这两个月数据发生了异常,需要去寻找原因。

4、对比分析
同一维度还常常做度量指标的对比分析,主要用于对比同维度间的差异性。比如我做支付业务,会去对比Top 国家的支付成功率,看哪个国家是我重点要关注的国家。
同漏斗分析类似,对比分析也可以快速找出最需要关注的维度指标,把资源用在刀刃上。(比如我印象很深,我的leader第一次做数据分析报告时,按Top国家做了国家维度的对比分析,大家很快知道哪些国家需要花资源重点解决,从此改变大家对支付业务的认知。以前大家可能以为支付需要持续接入新支付服务商,但是大家现在知道可以分重点国家差异性改善,不仅仅是无脑接入新支付服务商)
另外,在对比应用中,现在流行A/B test,A/B test的关键就是保证两组中只有一个单一变量,其他条件保持一致,实验组和对照组也是对比分析。
除了跟别人比,也可以自己跟自己比,统计学中的环比和同比便是自己跟自己比的应用。(比如到年底,我会做支付业务的复盘,会把连续几年的订单量和支付成功率做对比,看今年的整体情况)

5、帕累托分析
帕累托分析,平常也称之为二八定律。在任何一组东西中,最重要的只占其中一小部分,其余尽管是多数,却是次要的。
帕累托模型即是以二八定律为基础原理构建出的商品分析模型,这个模型最大的好处是可以对商品或者产品进行分类,按照投入产出比的优先次序原则,将自己的资源尽量投入到头部产品当中,以期产生最大的效益。
其核心思想就是少数项目贡献了大部分价值。以款式和销售量为例:男士服饰、运动服装及用品、儿童服装、女士皮鞋占总体销售额的70%以上。

6、交叉分析
交叉分析法就是将对比分析从多个维度进行交叉展现,进行多角度的结合分析,从中发现最为相关的维度来探索数据变化的原因。如下图,从APP\PC 端的维度结合漏斗做对比分析,可以发现APP在每一步转化率更好。

以上掌握了基本的数据分析方法,如何撰写一份分析报告增加它的可读性呢?
- 逻辑清晰:数据是怎么来的;发现了什么问题;总结问题发生的原因;如何解决这种问题;给出结论和解决方案。这样一个简单明了强逻辑关系的分析报告就能让绝大多数人接受;
- 报告图表化:用图表代替大量堆砌的数字会有助于人们更形象更直观地看清楚问题和结论,更容易做到有理有据;
- 规范化:整篇文档的图表风格统一、名词统一。数据有来源,口径有说明(特别是第一次引入数据统计口径时,要特别说明)。
至此,数据分析文章系列全文完。
结语
在最后,我想说几点的是:数据分析重在思路,更多在实践中训练自己数据思维,要有数据意识。连续写了4篇文章,也只是数据分析的一点点方法论,是工具层面的皮毛。到目前为止,我仍然有业务上的数据问题无法解开,可见,就算是成体系的所谓方法论也无法解决所有的实践问题。
想加以强调的是,无论是看了我的文章还是别处学习了其他知识&技能,都需要在自己实际业务场景下去应用,否则信息就只是信息,永远无法内化为自己的知识。
就我自身而言,从20年写第一篇数据分析的文章,到现在21年写四篇数据分析的文章。我相信在未来我还会持续迭代甚至推翻当前这套也是有可能,任何东西都不会学到即停止,它会被一直迭代和更新。
