数量 Volume
TB级
记录、日志
事务
表、文件
速度 Velocity
批处理
实时
多进程
数据流
真实性 Veracity
可信性
真伪性
来源&信誉
有效性
可审计性
大数据天然带有噪音,进入系统的数据缺乏控制,数据质量不高。
种类 Variety
结构化
非结构化
多因素
概率性
种类多样性:文字、语音、图片视频等,不再是单一的“关系”数据
数据来源多样性:同一个对象的数据来自不同的数据源,数据需要进行集成。
价值 Value
统计学
事件性
相关性
假设性
数据价值高,但是价值密度低,通过机器学习、统计模型以及算法深入复杂的数据分析,才能获得对未来趋势和模式