1.NameNode——存储文件名、文件目录结构、文件属性、以及每个文件块所在的DataNode的位置
2.DataNode——存储分散的文件块数据
3.SecondaryNode——是NameNode的秘书,备份NameNode的相关信息
适合一次写入,多次读取的场景——也就是只能追加写,而不能修改文件
优点
1.高容错:一个数据有多个副本,一个副本的丢失,会自动地恢复。
2.适合大数据:存储的数据规模与文件规模都很大
缺点
1.不适合低延时的数据访问
2.不适合对大量小文件的存储(一个小文件会占用一个128Mb的块空间,且文件地址寻址时间会超过读取时间)
3.不支持并发以及数据的修改


