谷歌三驾马车数据采集与预处理ODPS离线分析大数据体系 谷歌三驾马车 分布式处理技术MapReduce列式存储BigTable分布式文件系统GFS 数据采集与预处理A、数据存储 B、数据清洗C、数据查询分析D、数据可视化E A: Sqoop、Cannel、Flume B: HDFS、Kafka CD: MapReduce、Flink、Spark、Hadoop —-> HBase、Redis、RDBMS ODPS离线分析 大数据体系