谷歌三驾马车

  • 分布式处理技术MapReduce
  • 列式存储BigTable
  • 分布式文件系统GFS

    数据采集与预处理

  • A、数据存储

  • B、数据清洗
  • C、数据查询分析
  • D、数据可视化
  • E

基础知识 - 图1

A: Sqoop、Cannel、Flume

B: HDFS、Kafka

CD: MapReduce、Flink、Spark、Hadoop —-> HBase、Redis、RDBMS

基础知识 - 图2

ODPS离线分析

大数据体系