设备数据
{"Device": "27xS""place": "Vienna""coordinates": [48.2083, 16.3738]"time": "18:00""orientation": "north"}
介绍
背景:
- 数据越多 => 决策的likelihood似然概率可能会更好
存储设备便宜
概念|3V
volume:设备数据量的大小
- velocity:数据更新速度
variety:不同功能的数据
概念|三大类分析
descriptive 描述性统计|基于过去+当前数据
比如平均值,众数,中位数等
=> 适用于创建报告:分析进行总结predictive 预测|预测未来@回归分析
prescriptive 基于某情境,对比分析
对于给定的情境,分析不同行为决策的优、劣
概念|偏差
confirmation bias 确认偏差
起因:只有部分数据集
医疗、金融、教育容易受到不均衡数据的confirmation bias的负面影响availability heuristic 可用性启发式
即近因效应:最近可获得的数据影响权重更大
比如最近阅读的新闻,最近发生的事情
难点|数据安全
比如社交媒体数据
