(1)数据类型
定性数据 | -般通过问卷调查获取 | 分类数据:男女、天气等 (不能区分大小、不能加口减、不能乘除) |
顺序数据:满意度评分、幼儿园、 小学、中学、大学等(可以区分大 小) |
---|---|---|---|
定量数据 | -般通过日志获取 | 数值型数据离散型:用户数、消费 次数(可以加减) | 数值型数据连续型:成绩、消费金 额等(可以乘除) |
(2)数据收集方式
数据埋点 |
1. 如UV/PV 2. 用户数 3. 用户停留时间 4. 浏览页面 5. 等用户行数据 |
---|---|
第三方的数据平台 | 1. Growing IO. 2. SimilarWeb. 3. Google Analytics 4. 国家统计局网站 |
问卷调查 | 线上问卷调查:制作问卷工具:问卷星 线下问卷调查:电话回访等 |
(3)数据整理
数据异常表现 | 1. 空值 2. 波动太大 3. 不同数据源获取的数据矛盾 |
---|---|
数据异常原因 | 1. 系统故障 2. 人为因素 |
数据如何清洗 | 1. 删除异常值 2. 平均值填充 3. 通过统计计算值填充 4. 不同数据源的数 据交叉验证 |
案例:1.查看异常2.发现异常