1、Volume-数量到底拥有多少数据?当然,大数据意味着很大的数据量,但是正在利用的有多少?这个数量决定了分析要承载的容量。
    2、Velocity-速度数据收集、存储、处理的速度有多快?是接近拥有实时数据了,还是存在延迟?模型每隔多久需要接收新数据?速度决定了分析的时效性和相关性。
    3、Variety-类型拥有哪些种类的数据?它们的结构如何?数据源的丰富性如何?数据的类型是否足够多样化,以提供可用的建议?类型决定了分析是片面封闭的,还是全面整体的。
    4、Veracity-准确数据是准确的吗?其中是否存在缺漏?又存在多少噪声?准确性决定了分析的精准度。
    价值:第五个V前面所讲的四个V可能是行业惯例,但数据科学家越来越认识到,还有一个V甚至更为重要——价值(Value)。