MapReduce擅长处理什么类型的数据?

    • 离线批处理

    HBASE底层采用什么存储

    • 采用HDFS做底层的 键值存储模型

    YARN

    • 集群资源管理平台

    impala

    • 守护进程

    Hive

    • 即席查询慢,不适合交互式查询,可用pesto解决

    Spark

    • 可在内存中迭代处理

    Storm, Spark Streaming, Samza

    • 流处理,在无边界数据流上 实时分布式计算,可向Hadoop存储系统 或外部系统 发布结果

    Solr

    • 搜索平台,可对加入HDFS的文档进行索引,从而可搜索查询