主讲人:李启方 微信公众号:数据分析不是个事儿 《如何做一次完整的数据分析?》.mp4 (87.39MB)课程PPT(鼠标放在ppt上出现下载按钮)
完整的数据分析.pptx
课程笔记

一、完整的数据分析流程

以一个电商数据分析场景为例:
image.png
业务方需求:公司第2季度的营收利润怎么下降了这么多?帮忙分析一下这个季度利润下滑的原因?

数据分析流程就是上一节课(传送门)提及的5个关键词:

  1. 拆解问题
  2. 数据获取
  3. 数据清洗
  4. 分析手段
  5. 业务价值

1. 拆解问题:确定分析目标

  1. 业务问题是什么?

    为什么第2季度公司挣的钱少了?

  1. 业务的目的是什么?

    结合业务价值,给业务人员一个结果。基于利润下滑的原因,找到提高净利润的方法。表面上问的是“为什么”,实际是想知道“怎么办”。

  1. 业务目标拆解之后是什么?

    基于业务模式或营销模式,看“利润”能拆解成什么。电商的业务模式:客户看中了你的产品或服务,你把产品或服务卖出去,完成一个订单。因此可将订单的利润拆解为a.客户、b.产品或服务两个模块进行分析。

  1. 用到什么分析维度?

    过去的:原因诊断 未来的:趋势预测 现在的:现象评估

  1. 最终的分析目的?

    基于以上,得出分析目的:通过分析用户和产品两个模块,对企业的收入和成本进行异常值的原因诊断分析。


2. 建立指标体系

建立指标顺序:体->面->线->点,逐层拆解指标。 0.2 如何做一次完整的数据分析? - 图30.2 如何做一次完整的数据分析? - 图40.2 如何做一次完整的数据分析? - 图5此处省略【点】的拆解,点是指可用于表征业务逻辑的数据指标,比如:”活跃”的数据指标可以是PV、UV等,后面细说。


3. 数据采集和清洗

数据采集后面细讲,本次主要讲解数据清洗

3.1 清洗什么数据(WHAT)?

  • 不完整的数据

    • 数据缺失
    • 字段缺失
    • 缺失必要的逻辑关系
  • 前后不一致的数据

    • 字段和结构名不一致
  • 已经损坏的数据

    • 数据有偏差
    • 数据文件有损坏
    • 数据存储格式有误

3.2 怎么清洗数据(HOW)?

  • 筛选

    • 数据包含一些不必要的字符,如网络爬到的数据包含一些类似%22的编码解码
  • 清除

    • 不需要的字段直接删除
    • 先要备份原始数据,或者直接取数进行分析,不可破坏原始数据集
  • 补充

    • 以业务知识或经验推测填充缺失值
    • 以同一指标的计算结果填充缺失值
    • 以不同指标的计算结果填充缺失值
  • 修正

    • 时间、日期、数值、全半角等显示格式不一致,需将其处理为统一格式

4. 数据分析

本节以新用户为例进行分析

4.1 新用户的影响因素1:拉新

0.2 如何做一次完整的数据分析? - 图6

  • 拉新=引流=流量分析,确定分析目的

    将拉新转化为流量分析,通过对流量的分析,找到利润异常的原因。通过调整,尝试提高流量,并最终保证流量的稳定性。

  • 指标体系

    PV、UV、访问次数(visits)、平均访问深度(浏览量/访问次数)、平均停留时间(总停留时间/总浏览量)、跳失率(跳出次数/访问次数)

  • 数据提取-数据清洗-数据加工

    从数据库中取出数据,清洗后导入分析软件,进行可视化分析,具体会在实操章节讲解。

4.1.1 找流量规律

看整体流量,找规律。从4.1.1到4.1.5,体会从大到小逐步细分

一天当中,访问集中在9点到11点和14点到17点这段工作时间 image.png
一年中则在春节前后的访问量比较大,每周中也是访问集中在工作日
一般来说,流量都是以每天中的时段、季节、节假日、星期这样的规律来分布的,第二季度UV值持续下降

4.1.2 找流量异常

放大颗粒度,找异常流量

| 3月21日到4月17日到流量图中,工作日到流量一般都维持在2400左右,保持平稳

image.png
4月18日到5月15日到图,发现流量从4月19日下滑开始,很少突破2000,也就是流量在近一个月有明显下滑
原因可能是对手购买了竞价排名、自己的seo做的不好等等。

4.1.3 细分流量

对异常流量,从渠道、业务等维度细分流量

| 例如通过进一步分析发现,4月中旬开始的流量下降主要出现在pc端,那么可以进一步缩小问题的范围

image.png
业务流量对比,发现业务3、4下降,因此进一步缩小业务范围

4.1.4 分析流量结构

| 流量结构一般可分为渠道结构、业务结构、地区结构,通过查询一段时间内的各结构占比,了解流量组成。

image.png
如上图所示,在渠道中,pc占比相对过大,而app占比不高,app对于用户具有更大的黏度,所以应分析app占比过低原因,并想办法提高app流量占比。
下面的折线图可以对各渠道的流量情况进行追踪,分析占比不合理是短期内出现的,还是长期存在的、辅助问题的分析。

4.1.5 分析活动

| 对流量的追踪,一般就是对流量的监控,观察活动前、活动中、活动后的变化情况,评估活动效果

image.png
一般来讲,活动期间流量会大幅提升,活动后有一定回落,是一个成功的活动
如果活动期间流量上升幅度不大,或者活动结束后流量大幅度跌落,甚至流量低于活动前的正常流量很多,都不能说是一个成功的活动


4.1.6 流量对新用户影响的结论

3-4月份新用户的拉新减少了,代表着我们的客户减少,原因在于流量的降低。

细分分析后发现是PC端的整体流量降低,无论是PV、UV还是转化率等,初步结论是:

  1. 竞品购买了竞价排名,我们的SEO降低,考虑购买竞价,将SEO排名做上去
  2. app端占比太少,过度依靠PC端,考虑加大对app端的推广和优化,为app端用户提供更好服务,可以考虑app端的活动形式,提高app端的流量入口;
  3. PC端上在业务3、4的流量降低,说明业务3、4在手机端上不能满足用户需求,或者不是用户所需要的,或者是已经过时,建议降低这两个业务在app上的占比

4.2 新用户的影响因素2:转化

0.2 如何做一次完整的数据分析? - 图12

  • 转化=转化率:分析目的

    了解转化路径的各环节情况,分析其异常或不合理情况,进行调整,以提升各环节的转化率

  • 指标体系

    静默转化率、注册转化率、登录转化率、咨询转化率、付款转化率等等

  • 转化环节

    浏览页面(下载app) -> 注册 -> 登录 -> 添加商品到购物车 -> 下单 -> 付款 -> 完成交易

4.2.1 追踪环节异常

| 在4月17日到21日中间,转化率出现下滑趋势,常见的原因是公司运营部门投入了某个渠道进行推广,新的渠道带来了新的流量,而该渠道所引入的用户质量却偏低,拉低了整体的转化率

image.png
在4月22号之后,转化率开始抬头,并且维持了较高转化率,一般这种情况下短期内是活动带来,长期是产品改进带来的

4.2.2 环节分析

| 下单到付款中的转化率过低,猜测是:

  1. 又看了下其他家的商品或服务,发现了更好的,就取消了付款;
    1. 付款前习惯性的问下相关的人进行确认,然后发现计划有变,所以取消付款;
    1. 到了付款的时候发现居然不支持支付宝,无奈取消付款;
    1. 下单后被告知没货;
    1. 页面好卡,怒而弃之;
    1. 余额不足
image.png

4.2.3 细分环节分析

| 各渠道的转化率差别较大,其中pc端转化率明显偏低,而各业务之间的转化率差别不大,基本可以确定,是pc端存在问题,导致转化率偏低

image.png
各业务的转化率差别不大,但是也能看出来业务E的付款转化率是要低一些的,说明是业务本身的原因,可能是因为没货

4.2.4 对比环节分析

| 多角度对比来分析业务转化率的健康状况,包括与自己同期对比、行业中与自己相似产品对比、行业中优秀的产品对比。

image.png
对比各环节转化率的不同,产生数据上的冲击,所有落后的节点,都是可以提升的空间。
从行业上看,我们的转化率远远偏于正常值,从日期上对比,我们的转化率也降低了很多。

4.2.5 渠道环节分析

| 在右上象限中的渠道价值是比较大的,再综合考虑ROI,还可以看出渠道性价比情况。

image.png
一般来说渠道7和渠道8是价值比较大的渠道,我们需要从这里打开突破口

4.2.6 时间环节分析

| 该业务的付款与成交一般在前四周完成,而第五周开始趋于稳定。

image.png
知道以上信息后,可针对第五周未付款或完成交易的用户进行询问,提高转化率。
另外可制定四周内完成交易有奖励等活动来缩短成交周期,因为图中可以看出,绝大部分用户四周时间足够完成服务检查、订单确认等工作。

4.2.7 转化对新用户影响的结论

3-4月份新用户的转化率降低了,代表着我们的客户转化变少。

细分分析后发现是PC端的付款转化率异常,初步结论是:

  1. 公司引入的新渠道的转化率太低,还吸引走了大部分流量,建议重新考虑新渠道的价值,降低甚至取消新渠道业务
  2. PC端的付款系统有问题,可能是设计问题、造成卡顿,或者是货存问题、无法提前告知用户,建议改进付款系统
  3. 建议加大渠道7、渠道8的投放力度,能够尽量提升转化率。
  4. 建议对第五周没有付款的用户进行追踪,主动询问,提高转化率。

二、数据分析职业问题解答

1. 入职数据分析后,该做什么?

0.2 如何做一次完整的数据分析? - 图19

2. 数据分析是否有中年危机?是否加班?

结论:有中年危机,加班看情况

  • 天花板问题:行业天花板比较低,30-35岁出现分水岭,关键是对业务方面是否理解的透彻
  • 技术容易被抛弃
  • 管理岗位加班严重,普通分析人员是否加班与能否控制好沟通成本有关