1.四大优势
2.版本间的区别
3.HDFS架构概述
1.HDFS是hadoop中的一个模块
2.HDFS是用来存储数据的
3.(1)NameNode(nn):存储元数据,如文件名,文件目录结构,文件属性,块列表及块所在的DataNode。存储在内存中,一个元数据大概150Byte。
(2)DataNode(dn):本地文件系统存储文件块数据,以及块数据的校验和
(3)Secondary NameNode(2nn):每隔一段时间对Name Node元数据备份。
4.YARN架构概述
5.MapReduce架构概述
6.分布式系统需要具备的模块
分布式特性、分块存储、副本机制、元数据记录、抽象目录树、统一namespace命名空间