参考

从0开始建设大数据平台

离线计算组件

数据采集组件:FlinkX/DataX
数据存储组件:HDFS
数据加工组件:YARN/Hive/Spark/Flink
数据服务组件:HBase/Elasticsearch/Geomesa(时空数据库)/Kylin(OLAP 引擎)/MPP 数据库(可以用作即席交互查询,如 Greenplum、HAWQ)

实时计算组件

数据采集组件:flume/filebeat/Kafka
数据存储组件:Kafka
数据加工组件:Strom/Spark Stream/Flink Stream/Phoenix
数据服务组件:HBase/Elasticsearch/Geomesa(时空数据库)/MPP 数据库(可以用作即席交互查询,如 Greenplum、HAWQ)