背景
    我最近在招聘数据BI的岗位,业务上也是确实迫切需要这样的一个角色作为破局者的加入。但是我自身没有正规的这方面的培养,因为我是从一线业务运营出身的,我们那时候是个小团队,数据分析这种技能在很多岗位上是工作的一项技能和工作内容之一,但不是全部。例如,我在之前的团队里面,我是负责站内流量的,需要的是分析用户的内容偏好,用户功能留存变化等这些内容,分析不是日常工作,日常还是对内容渠道进行维护,内容调研,产品调研等工作,没有系统化地想过数据分析师这种岗位的岗位模型。所以我最近一直思考一些问题,如:数据分析师的指责是什么?如果专门有个数据分析师,那么他和其他业务岗位,技术岗位的关系是什么?什么样的组织需要一个专门的数据分析师?

    主要思考的问题:
    · 数据分析的职责是什么?
    · 数据分析的日常工作(工作流)是什么?

    数据分析工作流
    这张图是网络上对数据分析工作的一个梳理。从数据分析的工作流程出发,从抽象的层面定义这个岗位的日常工作,和所需要的技能。整个工作流程主要目标是服务于 Decision Making,作出更科学优质的决策。流程上分为三个步骤:

    1. Problem Resolving(问题分解、建模)
      1. 这部分主要是先确立问题(业务的核心问题是什么?我们需要决策什么内容,需要什么证据?)
    2. Data Manipulate (数据处理)

      1. 确立数据(证据)需求
      2. 数据处理(ETL、存储、计算)
    3. Data Visualization(数据可视化)
      1. 这部分主要是通过工具把数据以图形、报告的形式让决策者更方便地理解数据,并作出决策

    image.png

    结合我自身的经验,我觉得可以在此之上可以有很多补充和拓展,下图是我结合我自身经验的一些思考

    数据分析工作流 - 2.0
    目标
    目标依然没变,数据分析的目标始终是为了提升决策质量而存在。无论这个决策质量是提升ROI,提升算法准确性,提升用户活跃等等。

    工作流
    在 Data Manipulating 的环节,我把数据需求用另外一个系统化的过程代替 —— 领域建模。因为确定数据需求是有体系有方法的。成熟的领域如流量分析,站内留存,这些只要基于AARRR去做维度切分和下钻就ok了,拿来主义又快又好。不成熟的领域,则需要通过调研,过程梳理,确立原子指标等过程构建和打磨。

    在 Data Visualization 环节,我这边加入了挖掘和模型修正两个环节,因为这两个环节不是必要环节,所以用灰色作为底色。

    为什么要做数据挖掘?
    我在做技术支持工单分析的时候,问题识别环节里面有个问题是:这个产品现阶段遇到最多的问题是什么?这个问题转化来说就是,用户提问最多的句子是什么?当然用户对一个问题的描述是没发做到字字相同,所以简单的计数在做数据可视化之前就需要做一层问题的 nomalize 的工作,这个工作我自己先确立了一套可解释的方法,做了一些机器学习模型的套用后面作出一份业务方认可的统计结论和报告,这个详情我之后会总结出一份文章,也希望有过往经验的人和我分享您的思路。

    除了我个人的经历外,我看了很多业务在数据处理的基础上增加了很多数据挖掘的场景在里面,例如Magic Numbner的探索、因子分析、贡献度分析、聚类等等手段之后再做报告,需要得到更抽象的决策建议前,确实需要一些数据挖掘的处理。

    image.png