1
1.什么是问题?


2.界定问题的框架




- 发生了什么事情?(背景:切入点/序幕+困扰/困惑)

- 我们不愿看到什么?(非期望结果,现状,R1)

- 我们想要什么?(期望结果,目标,R2)


- 潜在客户名单已经失效。

- 推销信没有说服力。

- 邮寄效率低。
3.问题的各要素


- 切入点/序幕

- 困扰/困惑

- 现状(R1,非期望结果)

- 目标(R2,期望结果)

3.1 切入点/序幕



3.2 困扰/困惑







3.3 现状,非期望结果(R1)


- 对公司结构或流程产生负面影响。

- 扰乱某一特定方面的工作。

- 引发(或应该会引发)对业务、产品、流程的重新思考。

- 挑战(或应该会挑战)有关客户、市场、竞争、核心竞争力、流程或技术的基本假设。
3.4 目标,期望结果(R2)


- 实现全年增长目标。

- 将产品上市时间缩短1/3。

- 让超市收取合理的试销费用。

- 调整系统以保证正常运行。

- 有足够的生产能力满足预估需求。

4.总结

2

1.如何收集数据

1.1 确定收集哪些数据

1.2 为数据收集设置时间范围

1.3 确定数据收集方法

1.4 数据收集

2.数据收集方法

2.1 调查问卷


2.2 跟踪线上行为


2.3 跟踪交易数据


2.4 跟踪线上营销数据


2.5 监控社交媒体数据


2.6 监控实体店的人流量

3.总结

3

1.什么是数据清洗?


2.数据清洗和数据转换的区别?

3.如何清洗数据?

3.1 删除重复或不相关数据

3.2 修复结构上的错误

3.3 过滤不需要的异常值

3.4 处理缺失数据


- 丢弃包含缺失值的记录,这样做会丢失一些信息,所以在丢弃数据记录之前一定要做认真的考虑。

- 根据其他数据来对缺失值进行填充,使用这种方法有可能会损失数据的完整性,因为对数据的填充是基于一些假设的,并不是真实的值。
4.高质量数据的特征

- 有效的。数据符合业务规则或约束。

- 准确的。数据接近真实值。

- 完整的。包含了需要的全部数据。

- 一致的。某个数据集或者多个数据集中的数据是一致的。

- 统一的。数据采用的度量单位是统一的。
5.清洗数据的好处

6.总结

4
本节课我们对数据分析中常用的方法做下介绍。1.数据分析方法
1.1 5W2H分析法



























1.2 逻辑树分析法





- 芝加哥有多少架钢琴?

- 钢琴每年要调几次音?

- 调一次音需要多少时间?



- 芝加哥有多少人口。

- 有钢琴的人占多少比例。






1.3 多维度拆解分析方法









1.4 对比分析方法






- 绝对数比较


- 相对数比较


- 结构相对数:将同一总体内的部分数值与全部数值对比求得比重,用以说明事物的性质、结构和质量。如居民食品支出额占消费支出总额比重、产品合格率等。

- 比例相对数:将同一总体内不同部分的数值对比,表明总体内各部分的比例关系,如人口性别比例、投资与消费比例等。

- 比较相对数:将同一时期两个性质相同的指标数值对比,说明同类现象在不同空间条件下的数量对比关系。如不同地区商品价格对比,不同行业、不同企业间某项指标对比等。

- 强度相对数:将两个性质不同但有一定联系的总量指标对比,用以说明现象的强度、密度和普遍程度。如人均国内生产总值用元/人表示,人口密度用人/平方公里表示。

- 计划完成程度相对数:是某一时期实际完成数与计划数对比,用以说明计划完成程度。

- 动态相对数:将同一现象在不同时期的指标数值对比,用以说明发展方向和变化的速度。如发展速度、增长速度等。



- 时间标准:选择不同时间的指标数值作为对比标准,最常用的是与上年同期比较即“同比”,还可以与前一时期比较,此外还可以与达到历史最好水平的时期或历史上一些关键时期进行比较。

- 空间标准:选择不同空间指标数据进行比较。

- 经验或理论标准:通过对大量历史资料的归纳总结而得到的标准。如衡量生活质量的恩格尔系数。理论标准则是通过已知理论经过推理得到的依据。

- 计划标准:计划标准即与计划数、定额数、目标数对比。
1.5 分组分析法





- 确定组数。这个可以由数据分析师决定,根据数据本身的特点来判断确定。由于分组的目的之一是为了观察数据分布的特征,因此确定的组数应适中。如果组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。

- 确定各组的组距。组距是一个组的最大值与最小值之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)/组数。

- 根据组距大小,对数据进行分组整理,划归至相应组内。


1.6 漏斗图分析法





2.总结

5
1.什么是数据可视化?

2.数据可视化的优势


3.如何进行数据可视化?


- 我的受众是谁?

- 他们有什么问题?

- 我为他们寻找的答案是什么?

- 我想说的是什么?

- 我的数据可视化可以激发其他什么问题?

3.1 选择正确的图表









3.2 注意页面的布局

3.3 注意颜色的使用

3.4 通过形状和设计来传递上下文


3.5 策略性地使用大小对值可视化


3.6 注意文本的使用


- 将最重要的图表放在顶部或左上角。因为我们的眼睛通常首先被这个区域吸引。

- 将可视化中的图表数量限制为三个或四个。如果添加太多,就会迷失在细节中。

- 如果有多个过滤器,尝试将它们组合在一起。并用浅色边框将他们围起来,这样会给我们一个视觉提示,表明它们具有共同的特征。

- 增加可视化的互动性,互动性往往具有点石成金的作用。在增加了互动性之后,要鼓励观众进行探索,以使得他们能够参与进来。
4.总结

6
每当进行数据分析时,我们的最终目的是将分析过程和结果写成易于理解的分析报告,而分析报告的撰写往往会对分析人员造成很大的困难。而对于大多数读者来说,数据分析报告中技术相关的内容是难于理解的。于是,不管是从写作者的角度还是从读者的角度,一个易于理解的数据分析报告的撰写都不是一件容易的事情。下面我们从三个方面来讲下如何撰写数据分析报告。1.明确内容



- 执行摘要:


- 概述:


- 摘要:

2.明确受众


2.1 受众是谁

2.2 受众的特征

2.3 受众的目标

2.4 报告的截止日期

2.5 报告的呈现形式












3.吸引受众的注意力

3.1 找到共同点

3.2 摒弃无关内容

3.3 为报告定调

3.4 优化报告

4.总结

