步骤一:问题分解、建模

这个部分的拆解质量会直接决定决策的有效性,也是最难入手的一部分,也是大多数人即使身怀绝技,也难为“无米之炊”。例如你/公司想保住你的财富,想了解黄金价格的影响因素,有过黄金历史研究的人、会比没有的人有更多的见解,他们知道影响 主要目标 —— 黄金价格,的 相关性因子、因果(逻辑关系、充分必要条件)、对比参照物(CPI、大宗商品价格、债券利率)所以如果你想快速入门,首先得了解该领域里面的 KOL,他们的观点、他们的研究。
通用捷径:关注该领域的热点,利用好搜索引擎、推荐引擎,直接抄作业
通用方法论:
· 描述性统计:发生了什么?均值、中位数如何?相比较在什么水平?
· 诊断性分析:为什么发生?什么事物、维度影响了它?
· 可视化证据:明细表格、占比、趋势能否说明它?
· 预测性分析:之后会有什么可能?
· 指导性分析:需要做什么?

步骤二:数据处理

Pass,这部分涵盖内容较多,主要是工具层面,先排除在方法论层面

步骤三:可视化、决策推演

按结论类型可以采用不同的展示方案

结论所需数据类型 可视化对象
明细数据 表格、交叉表
趋势 折线图
对比 柱状图
下钻 组合图

其他需要了解的事情

  1. 关键的还是 对领域知识的理解和对事实的观察。所有模型都源于人对世界的观察和认知,统计和分析只是入门工具,经验和认知能力决定了数据分析结论逼近事实的程度。
  2. 对问题的拆解很重要,尤其是复杂问题。比如,”用户流量是什么?有什么问题?要如何提升?“这类问题,如果不对其进行拆解,宽泛的问题只能得到宽泛的答案。相对的,只有拆解到一定的简单程度,才能选择逐一选择合适的数据分析方法论,完成分析。但是拆解恰恰是最难的,在明确1个或1类数据后,统计学很有用,但是在拆解问题上却是效用最差的方法。

image.png