- 是什么?
分布式文件系统:为了解决大量数据的存储问题,数据会分布在多台服务器上
- 组成?
NameNode(元数据)
DataNode(实际数据)
SecondaryNameNode(并不是热备,只是辅助)
- 应用场景:
一次写入,多次读取
- 优点?
存储大量数据
高容错率
自动生成多个副本
自动回复丢失副本
- 缺点?
不适合小文件存储:
因为小文件namenode上的元数据会占用大量内存(要存储等文件大小的数据需要更多的元数据信息)
因而小文件的寻址时间也会大大提升
存储速度慢:
不适合做毫秒级的实时数据存储
不支持并发写入、文件随机修改:
只能有一个写,不支持多线程写入
进支持append追加的操作。
修改,只能从客户端下载下来再上传回客户端