设备数据

  1. {
  2. "Device": "27xS"
  3. "place": "Vienna"
  4. "coordinates": [48.2083, 16.3738]
  5. "time": "18:00"
  6. "orientation": "north"
  7. }

介绍

背景:

  • 数据越多 => 决策的likelihood似然概率可能会更好
  • 存储设备便宜

    概念|3V

  • volume:设备数据量的大小

  • velocity:数据更新速度
  • variety:不同功能的数据

    概念|三大类分析

    descriptive 描述性统计|基于过去+当前数据

    比如平均值,众数,中位数等
    => 适用于创建报告:分析进行总结

    predictive 预测|预测未来@回归分析

    prescriptive 基于某情境,对比分析

    对于给定的情境,分析不同行为决策的优、劣

    概念|偏差

    confirmation bias 确认偏差

    起因:只有部分数据集
    医疗、金融、教育容易受到不均衡数据的confirmation bias的负面影响

    availability heuristic 可用性启发式

    即近因效应:最近可获得的数据影响权重更大

  • 比如最近阅读的新闻,最近发生的事情

    难点|数据安全

    比如社交媒体数据