• 是什么?

    分布式文件系统:为了解决大量数据的存储问题,数据会分布在多台服务器上


    • 组成?

    NameNode(元数据)
    DataNode(实际数据)
    SecondaryNameNode(并不是热备,只是辅助)


    • 应用场景:

    一次写入,多次读取


    • 优点?
    1. 存储大量数据

    2. 高容错率

    自动生成多个副本
    自动回复丢失副本


    • 缺点?

    不适合小文件存储:
    因为小文件namenode上的元数据会占用大量内存(要存储等文件大小的数据需要更多的元数据信息)
    因而小文件的寻址时间也会大大提升

    存储速度慢:
    不适合做毫秒级的实时数据存储

    不支持并发写入、文件随机修改:
    只能有一个写,不支持多线程写入
    进支持append追加的操作。
    修改,只能从客户端下载下来再上传回客户端