常用大数据组件
- NoSQL:HBase、Redis、MongoDB……
- 消息系统:Kafka、StormMQ、ZeroMQ、RabbitMQ……
- 流式计算:Storm、Spark Streaming、S4、Heron、Kafka Streams、Flink……
- 机器学习:Mahout、Spark ML……
- 集群管理与监控:Ambari、Ganglia、Nagios、Cloudera Manager、Prometheus……
- 查询分析:Hive、Pig、Phoenix、SparkSQL、Drill、Druid、Greeplum……
- 即席查询:Impala、Presto(混合计算)、Kylin、ClickHouse……
- 文件存储:HDFS、Alluxio(Tachyon)……
- 离线计算:MapReduce、Spark、Flink……
- 日志收集:Flume、Scribe、Logstash、Elastic Beats……
- 资源管理:Yarn、Mesos、Kubernetes(k8s)……
- 分布式协调服务:ZooKeeper(Zab)、Etcd(Raft)、Consul(Raft)、Chubby(Paxos)……
- 任务调度:Azkaban、Oozie、XXL-JOB(大众点评)、Elastic Job(当当网)、Airflow……
- 质量管理:Griffin……
- 元数据管理:Atlas、Metacat……
- 数据同步:(离线:Kettle、Sqoop、DataX)、(实时:FlinkX、Maxwell、Canal、FlinkCDC、DBus)……
- 全文检索:Lucene、Elasticsearch、Solr……
- 认证授权:Kerberos、Ranger……
- BI工具:Superset、Davinci……
- 分布式数据库(HTAP):PolarDB-X、OceanBase、CBase、TiDB(mysql)、Guass200(pg)….