主讲人:李启方 微信公众号:数据分析不是个事儿 课程PPT(鼠标放在ppt上出现下载按钮)
完整的数据分析.pptx
课程笔记一、完整的数据分析流程
以一个电商数据分析场景为例:
业务方需求:公司第2季度的营收利润怎么下降了这么多?帮忙分析一下这个季度利润下滑的原因?
数据分析流程就是上一节课(传送门)提及的5个关键词:
- 拆解问题
- 数据获取
- 数据清洗
- 分析手段
- 业务价值
1. 拆解问题:确定分析目标
- 业务问题是什么?
为什么第2季度公司挣的钱少了?
- 业务的目的是什么?
结合业务价值,给业务人员一个结果。基于利润下滑的原因,找到提高净利润的方法。表面上问的是“为什么”,实际是想知道“怎么办”。
- 业务目标拆解之后是什么?
基于业务模式或营销模式,看“利润”能拆解成什么。电商的业务模式:客户看中了你的产品或服务,你把产品或服务卖出去,完成一个订单。因此可将订单的利润拆解为a.客户、b.产品或服务两个模块进行分析。
- 用到什么分析维度?
过去的:原因诊断 未来的:趋势预测 现在的:现象评估
- 最终的分析目的?
基于以上,得出分析目的:通过分析用户和产品两个模块,对企业的收入和成本进行异常值的原因诊断分析。
2. 建立指标体系
建立指标顺序:体->面->线->点,逐层拆解指标。 此处省略【点】的拆解,点是指可用于表征业务逻辑的数据指标,比如:”活跃”的数据指标可以是PV、UV等,后面细说。
3. 数据采集和清洗
数据采集后面细讲,本次主要讲解数据清洗
3.1 清洗什么数据(WHAT)?
不完整的数据
- 数据缺失
- 字段缺失
- 缺失必要的逻辑关系
前后不一致的数据
- 字段和结构名不一致
已经损坏的数据
- 数据有偏差
- 数据文件有损坏
- 数据存储格式有误
3.2 怎么清洗数据(HOW)?
筛选
- 数据包含一些不必要的字符,如网络爬到的数据包含一些类似%22的编码解码
清除
- 不需要的字段直接删除
- 先要备份原始数据,或者直接取数进行分析,不可破坏原始数据集
补充
- 以业务知识或经验推测填充缺失值
- 以同一指标的计算结果填充缺失值
- 以不同指标的计算结果填充缺失值
修正
- 时间、日期、数值、全半角等显示格式不一致,需将其处理为统一格式
4. 数据分析
本节以新用户为例进行分析
4.1 新用户的影响因素1:拉新
- 拉新=引流=流量分析,确定分析目的
将拉新转化为流量分析,通过对流量的分析,找到利润异常的原因。通过调整,尝试提高流量,并最终保证流量的稳定性。
- 指标体系
PV、UV、访问次数(visits)、平均访问深度(浏览量/访问次数)、平均停留时间(总停留时间/总浏览量)、跳失率(跳出次数/访问次数)
- 数据提取-数据清洗-数据加工
从数据库中取出数据,清洗后导入分析软件,进行可视化分析,具体会在实操章节讲解。
4.1.1 找流量规律
看整体流量,找规律。从4.1.1到4.1.5,体会从大到小逐步细分
一天当中,访问集中在9点到11点和14点到17点这段工作时间 | |
---|---|
一年中则在春节前后的访问量比较大,每周中也是访问集中在工作日 | |
一般来说,流量都是以每天中的时段、季节、节假日、星期这样的规律来分布的,第二季度UV值持续下降 |
4.1.2 找流量异常
放大颗粒度,找异常流量
| 3月21日到4月17日到流量图中,工作日到流量一般都维持在2400左右,保持平稳
4月18日到5月15日到图,发现流量从4月19日下滑开始,很少突破2000,也就是流量在近一个月有明显下滑 |
|
原因可能是对手购买了竞价排名、自己的seo做的不好等等。 |
4.1.3 细分流量
对异常流量,从渠道、业务等维度细分流量
| 例如通过进一步分析发现,4月中旬开始的流量下降主要出现在pc端,那么可以进一步缩小问题的范围
业务流量对比,发现业务3、4下降,因此进一步缩小业务范围 |
4.1.4 分析流量结构
| 流量结构一般可分为渠道结构、业务结构、地区结构,通过查询一段时间内的各结构占比,了解流量组成。
如上图所示,在渠道中,pc占比相对过大,而app占比不高,app对于用户具有更大的黏度,所以应分析app占比过低原因,并想办法提高app流量占比。 |
|
下面的折线图可以对各渠道的流量情况进行追踪,分析占比不合理是短期内出现的,还是长期存在的、辅助问题的分析。 |
4.1.5 分析活动
| 对流量的追踪,一般就是对流量的监控,观察活动前、活动中、活动后的变化情况,评估活动效果
一般来讲,活动期间流量会大幅提升,活动后有一定回落,是一个成功的活动 |
|
如果活动期间流量上升幅度不大,或者活动结束后流量大幅度跌落,甚至流量低于活动前的正常流量很多,都不能说是一个成功的活动 |
4.1.6 流量对新用户影响的结论
3-4月份新用户的拉新减少了,代表着我们的客户减少,原因在于流量的降低。
细分分析后发现是PC端的整体流量降低,无论是PV、UV还是转化率等,初步结论是:
- 竞品购买了竞价排名,我们的SEO降低,考虑购买竞价,将SEO排名做上去;
- app端占比太少,过度依靠PC端,考虑加大对app端的推广和优化,为app端用户提供更好服务,可以考虑app端的活动形式,提高app端的流量入口;
- PC端上在业务3、4的流量降低,说明业务3、4在手机端上不能满足用户需求,或者不是用户所需要的,或者是已经过时,建议降低这两个业务在app上的占比。
4.2 新用户的影响因素2:转化
- 转化=转化率:分析目的
了解转化路径的各环节情况,分析其异常或不合理情况,进行调整,以提升各环节的转化率
- 指标体系
静默转化率、注册转化率、登录转化率、咨询转化率、付款转化率等等
- 转化环节
浏览页面(下载app) -> 注册 -> 登录 -> 添加商品到购物车 -> 下单 -> 付款 -> 完成交易
4.2.1 追踪环节异常
| 在4月17日到21日中间,转化率出现下滑趋势,常见的原因是公司运营部门投入了某个渠道进行推广,新的渠道带来了新的流量,而该渠道所引入的用户质量却偏低,拉低了整体的转化率
在4月22号之后,转化率开始抬头,并且维持了较高转化率,一般这种情况下短期内是活动带来,长期是产品改进带来的 |
4.2.2 环节分析
| 下单到付款中的转化率过低,猜测是:
- 又看了下其他家的商品或服务,发现了更好的,就取消了付款;
1. 付款前习惯性的问下相关的人进行确认,然后发现计划有变,所以取消付款;
1. 到了付款的时候发现居然不支持支付宝,无奈取消付款;
1. 下单后被告知没货;
1. 页面好卡,怒而弃之;
1. 余额不足
4.2.3 细分环节分析
| 各渠道的转化率差别较大,其中pc端转化率明显偏低,而各业务之间的转化率差别不大,基本可以确定,是pc端存在问题,导致转化率偏低
各业务的转化率差别不大,但是也能看出来业务E的付款转化率是要低一些的,说明是业务本身的原因,可能是因为没货 |
4.2.4 对比环节分析
| 多角度对比来分析业务转化率的健康状况,包括与自己同期对比、行业中与自己相似产品对比、行业中优秀的产品对比。
对比各环节转化率的不同,产生数据上的冲击,所有落后的节点,都是可以提升的空间。 | |
从行业上看,我们的转化率远远偏于正常值,从日期上对比,我们的转化率也降低了很多。 |
4.2.5 渠道环节分析
| 在右上象限中的渠道价值是比较大的,再综合考虑ROI,还可以看出渠道性价比情况。
一般来说渠道7和渠道8是价值比较大的渠道,我们需要从这里打开突破口 |
4.2.6 时间环节分析
| 该业务的付款与成交一般在前四周完成,而第五周开始趋于稳定。
知道以上信息后,可针对第五周未付款或完成交易的用户进行询问,提高转化率。 |
|
另外可制定四周内完成交易有奖励等活动来缩短成交周期,因为图中可以看出,绝大部分用户四周时间足够完成服务检查、订单确认等工作。 |
4.2.7 转化对新用户影响的结论
3-4月份新用户的转化率降低了,代表着我们的客户转化变少。
细分分析后发现是PC端的付款转化率异常,初步结论是:
- 公司引入的新渠道的转化率太低,还吸引走了大部分流量,建议重新考虑新渠道的价值,降低甚至取消新渠道业务。
- PC端的付款系统有问题,可能是设计问题、造成卡顿,或者是货存问题、无法提前告知用户,建议改进付款系统。
- 建议加大渠道7、渠道8的投放力度,能够尽量提升转化率。
- 建议对第五周没有付款的用户进行追踪,主动询问,提高转化率。
二、数据分析职业问题解答
1. 入职数据分析后,该做什么?
2. 数据分析是否有中年危机?是否加班?
结论:有中年危机,加班看情况
- 天花板问题:行业天花板比较低,30-35岁出现分水岭,关键是对业务方面是否理解的透彻
- 技术容易被抛弃
- 管理岗位加班严重,普通分析人员是否加班与能否控制好沟通成本有关