(1)数据类型

定性数据 -般通过问卷调查获取 分类数据:男女、天气等
(不能区分大小、不能加口减、不能乘除)
顺序数据:满意度评分、幼儿园、 小学、中学、大学等(可以区分大 小)
定量数据 -般通过日志获取 数值型数据离散型:用户数、消费 次数(可以加减) 数值型数据连续型:成绩、消费金 额等(可以乘除)

image.png(2)数据收集方式

数据埋点

1. 如UV/PV
2. 用户数
3. 用户停留时间
4. 浏览页面
5. 等用户行数据
第三方的数据平台
1. Growing IO.
2. SimilarWeb.
3. Google Analytics
4. 国家统计局网站
问卷调查 线上问卷调查:制作问卷工具:问卷星
线下问卷调查:电话回访等

(3)数据整理

数据异常表现
1. 空值
2. 波动太大
3. 不同数据源获取的数据矛盾
数据异常原因
1. 系统故障
2. 人为因素
数据如何清洗
1. 删除异常值
2. 平均值填充
3. 通过统计计算值填充
4. 不同数据源的数 据交叉验证

案例:1.查看异常image.png2.发现异常
image.png