老张见完潜在结婚对象,不甚满意,得出以下数字:

  • 月入过万
  • 长相6分
  • 八成不怎么样
  • 总体7分
  • ……

大部分数字没有来源,没有说明采集方式,没有度量。这些脱口而出的三无产品,往往反映的是感受,而非事实。

数据 是数据分析的基础。数据三要素:

  1. 数据来源(从哪里来)
  2. 采集方式(以何种方式收集)
  3. 记录格式(以何种形式记录,单位,字段类型)

如何了解老张潜在结婚对象的工资 数据
知道他是什么企业,什么部门的,则

  • 去招聘网站査询,该企业招聘的岗位薪酬范围(适用于新人)
  • 去找猎头了解,该企业跳槽走的人大概是什么范围(适用于老人)
  • 直接看工资单,股票账户等

每种方式都有一定局限性。实际上,获取 真实数据 需要很大成本,并且不一定能完整。
数据分析 ,就是一个用技术、业务手段尽可能接近真相的过程。

考察真实数据后,发现:

  • 学历,收入和老张相近
  • 长相相近
  • 年龄比老张小好几岁

不足以支撑老张的“7分”的结论。
进一步沟通,发现根本原因是老张觉得“90后的女生都很拽,聊不下去”,意味着:

  • 老张觉得大部分90后女生都很拽
  • 老张觉得非90后,比如80后,是不拽的

这个结论很容易检验,找反例即可。
如果老张和80后也聊不下去,说明他和所有适婚年龄的女性都聊不下去,则不是90后的问题。
如果老张和90后中的部分女性能聊下去,说明是老张选择目标有问题。
数据分析的过程,就是一个 假设 - 检验 - 总结 - 再假设 的过程。
**
要想细致地分析老张自身的问题,得先细致了解过程。老张认识潜在结婚对象的流程如图:
流程.png
有了假设,采集数据 验证 就如前面获取工资数据那样简单。
image.png

很多问题不用分析也能得出恰当的结论。比如直接看老张潜在结婚对象的照片,就能发现老张“癞蛤蟆想吃天鹅肉”。然而,真正的痛点,就会需要真正的分析。

数据分析的本质

数据分析的本质,是把思维建立在牢固的事实基础上,通过有逻辑的分析,推理出接近真相的答案。不仅仅是ESP( Excel,sql, Python),不仅仅是一个操作跑数据的工具。
学习数据分析技能(ESP)是一个人的事,但从事数据分析工作是一群人的事。想深入了解工作,得先搞清我们要和谁(部门)打交道,才能搞懂我们到底要做什么。
数据分析的价值是由作用而非技能决定,不能解决问题的数据分析师终被淘汰。