前言

数据分析的认识

基于统计/业务

  • 对象:中小企业、数据化不完善
  • 目的:如何实现“业务-数据-业务”的过程
  • 过程:

    1. 业务产生数据

      • 如何把业务进行合理的数据化
      • 如何用一张表代表一个业务场景,一条记录代表一个业务事件。
      • 如何把不同业务场景合理连接。
    2. 基于简单统计的数据分析

      • 合理的预处理
      • 对不同维度、粒度数据的分组
      • 合理的聚合函数
      • 独立性分析、假设检验、方差分析(偏学术)

        • 有没有关系
        • 是否符合某分布
        • 检测差异\波动来源
    3. 数据反馈业务

      • 关键指标

        • 基于不同指标的不同策略
        • 展现、点击、转化、
      • 什么颜色、尺寸卖的最好
      • 什么价格段卖的最好
      • 各种统计的同比、环比等比例区别、数值区别。
    4. 可视化数据面板展示

      • 关键指标
      • 粗粒度
      • 细粒度

基于挖掘模型(未入门)

  • 对象:有一定规模的数据产出,相对规范的数据来源
  • 目的:“从潜在的数据信息-可利用的数据观点”
  • 过程:

    1. 多途径的数据来源

      • 日志、点击、图像、大量统计
    2. 从数据来源到可以处理的数据抽象

      • ETL
      • 预处理
    3. 数据挖掘模型的选择、转换拟合、评估、调整

      • 分类
      • 聚类
      • 回归
    4. 举例

      • 用户画像 (针对不同类别用户的价值分析)
      • 推荐系统 (面包啤酒与尿布)