1.四大优势

image.png

2.版本间的区别

image.png

3.HDFS架构概述

1.HDFS是hadoop中的一个模块
2.HDFS是用来存储数据的
3.(1)NameNode(nn):存储元数据,如文件名,文件目录结构,文件属性,块列表及块所在的DataNode。存储在内存中,一个元数据大概150Byte。
(2)DataNode(dn):本地文件系统存储文件块数据,以及块数据的校验和
(3)Secondary NameNode(2nn):每隔一段时间对Name Node元数据备份。
image.png

4.YARN架构概述

image.png

5.MapReduce架构概述

image.png

6.分布式系统需要具备的模块

分布式特性分块存储副本机制元数据记录抽象目录树统一namespace命名空间