HDFS 数据管理和容错
    每个数据块有3个副本,分布在俩个机架内的三个节点中
    HDFS 原理 - 图1
    心跳检测
    HDFS 原理 - 图2
    二级
    Secondary NameNode 是配合NmaNode工作的一个节点,两者同时工作,并不是备份
    SNN是冷备,不是热备
    http://www.jianshu.com/p/5d292a9a8c86
    Secondary NameNode:它究竟有什么作用?
    Secondary NameNode的整个目的是在HDFS中提供一个检查点。它只是NameNode的一个助手节点。这也是它在社区内被认为是检查点节点的原因。
    Secondary NameNode所做的不过是在文件系统中设置一个检查点来帮助NameNode更好的工作。它不是要取代掉NameNode也不是NameNode的备份
    HDFS中文件读取的流程
    HDFS 原理 - 图3
    HDFS 原理 - 图4
    HDFS的特点

    • 数据冗余 硬件容错
    • 流式的数据访问 写一次 读多次。一旦写入无法修改,只能通过写入到新的块删除旧文件
    • 适合存储大文件,如果是很多小文件,NameNode压力会很大

    HDFS适用性及局限性:
    1、适合数据批量读写,吞吐量高
    2、不适合交互式应用、低延迟很难满足
    3、适合一次写入多次读取、顺序读写
    4、不支持多用户并发写相同文件