老张见完潜在结婚对象,不甚满意,得出以下数字:
- 月入过万
- 长相6分
- 八成不怎么样
- 总体7分
- ……
大部分数字没有来源,没有说明采集方式,没有度量。这些脱口而出的三无产品,往往反映的是感受,而非事实。
数据
是数据分析的基础。数据三要素:
- 数据来源(从哪里来)
- 采集方式(以何种方式收集)
- 记录格式(以何种形式记录,单位,字段类型)
如何了解老张潜在结婚对象的工资 数据
?
知道他是什么企业,什么部门的,则
- 去招聘网站査询,该企业招聘的岗位薪酬范围(适用于新人)
- 去找猎头了解,该企业跳槽走的人大概是什么范围(适用于老人)
- 直接看工资单,股票账户等
每种方式都有一定局限性。实际上,获取 真实数据
需要很大成本,并且不一定能完整。数据分析
,就是一个用技术、业务手段尽可能接近真相的过程。
考察真实数据后,发现:
- 学历,收入和老张相近
- 长相相近
- 年龄比老张小好几岁
不足以支撑老张的“7分”的结论。
进一步沟通,发现根本原因是老张觉得“90后的女生都很拽,聊不下去”,意味着:
- 老张觉得大部分90后女生都很拽
- 老张觉得非90后,比如80后,是不拽的
这个结论很容易检验,找反例即可。
如果老张和80后也聊不下去,说明他和所有适婚年龄的女性都聊不下去,则不是90后的问题。
如果老张和90后中的部分女性能聊下去,说明是老张选择目标有问题。
数据分析的过程,就是一个 假设 - 检验 - 总结 - 再假设
的过程。
**
要想细致地分析老张自身的问题,得先细致了解过程。老张认识潜在结婚对象的流程如图:
有了假设,采集数据 验证
就如前面获取工资数据那样简单。
很多问题不用分析也能得出恰当的结论。比如直接看老张潜在结婚对象的照片,就能发现老张“癞蛤蟆想吃天鹅肉”。然而,真正的痛点,就会需要真正的分析。
数据分析的本质
数据分析的本质,是把思维建立在牢固的事实基础上,通过有逻辑的分析,推理出接近真相的答案。不仅仅是ESP( Excel,sql, Python),不仅仅是一个操作跑数据的工具。
学习数据分析技能(ESP)是一个人的事,但从事数据分析工作是一群人的事。想深入了解工作,得先搞清我们要和谁(部门)打交道,才能搞懂我们到底要做什么。
数据分析的价值是由作用而非技能决定,不能解决问题的数据分析师终被淘汰。