Hadoop_old - 图1
重新编译,以便支持snappy算法。

HDFS

image.png

HDFS写流程

image.png
Hadoop_old - 图4

HDFS读流程

image.png

HDFS元数据管理

namenode保存在内存上
image.png
Hadoop_old - 图7

SecondNameNode

定期合并edit logs到fsimage,替换fsimage
Hadoop_old - 图8

HDFS高可用

Hadoop_old - 图9

MapReduce

Hadoop_old - 图10

  • 分区
  • 排序
  • 规约
  • 分组

    MapReduce的分区与分组的区别

    image.png
    image.png

HIVE

  • 从HDFS加载创建表,是剪切操作。

    分区表

  • 分区就是分文件夹

分桶

  • 分桶就是mapreduce中的分区