前言
数据分析的认识
基于统计/业务
- 对象:中小企业、数据化不完善
- 目的:如何实现“业务-数据-业务”的过程
过程:
业务产生数据
- 如何把业务进行合理的数据化
- 如何用一张表代表一个业务场景,一条记录代表一个业务事件。
- 如何把不同业务场景合理连接。
基于简单统计的数据分析
- 合理的预处理
- 对不同维度、粒度数据的分组
- 合理的聚合函数
独立性分析、假设检验、方差分析(偏学术)
- 有没有关系
- 是否符合某分布
- 检测差异\波动来源
数据反馈业务
关键指标
- 基于不同指标的不同策略
- 展现、点击、转化、
- 什么颜色、尺寸卖的最好
- 什么价格段卖的最好
- 各种统计的同比、环比等比例区别、数值区别。
可视化数据面板展示
- 关键指标
- 粗粒度
- 细粒度
基于挖掘模型(未入门)
- 对象:有一定规模的数据产出,相对规范的数据来源
- 目的:“从潜在的数据信息-可利用的数据观点”
过程:
多途径的数据来源
- 日志、点击、图像、大量统计
从数据来源到可以处理的数据抽象
- ETL
- 预处理
数据挖掘模型的选择、转换拟合、评估、调整
- 分类
- 聚类
- 回归
举例
- 用户画像 (针对不同类别用户的价值分析)
- 推荐系统 (面包啤酒与尿布)
