一:HA

1:hdfs单点故障

单点故障:
高可用方案:HA(High Available)
多个NN,主备切换,主
压力过大,内存受限:
联帮机制: Federation(元数据分片)
多个NN,管理不同的元数据 HADOOP 2.x 只支持HA的一主一备

解决方案:
image.png

2:Paxos 算法

Paxos算法是莱斯利·兰伯特于1990年提出的一种基于消息传递的一致性算法。 这个算法被认为是类似算法中最有效的。 该算法覆盖全部场景的一致性。 每种技术会根据自己技术的特征选择简化算法实现。 传递:NN之间通过一个可靠的传输技术,最终数据能同步就可以 我们一般假设网络等因素是稳定的 类似一种带存储能力的消息队列,解决NNActive 和 NNStandby数据一致性问题
**

3:HDFS-HA解决方案

HA方案: 多台NN主备模式,Active和Standby状态
Active对外提供服务
增加journalnode角色(>3台),负责同步NN的editlog
最终一致性
增加zkfc角色(与NN同台),通过zookeeper集群协调NN的主从选举和切换
事件回调机制
DN同时向NNs汇报block清单

4:HDFS- Federation解决方案

NN的压力过大,内存受限问题: 元数据分治,复用DN存储 元数据访问隔离性 DN目录隔离block
image.png

二:搭建FULL-HA

1:服务器规划

HOST NN NN SNN DN ZKFC ZK
node01 *


*
node02
* * * * *
node03


*
*
node04


*
*

2:部署配置

1:免密

node01 - node02~node04

node02 - node01
node02:
cd ~/.ssh
ssh-keygen -t dsa -P ‘’ -f ./id_dsa
cat id_dsa.pub >> authorized_keys
scp ./id_dsa.pub node01:pwd/node02.pub
node01:
cd ~/.ssh
cat node02.pub >> authorized_keys

2:zk集群搭建

node02:
tar xf zook….tar.gz
mv zoo… /opt/bigdata
cd /opt/bigdata/zoo….
cd conf
cp zoo_sample.cfg zoo.cfg
vi zoo.cfg

  1. datadir=/var/bigdata/hadoop/zk
  2. server.1=node02:2888:3888
  3. server.2=node03:2888:3888
  4. server.3=node04:2888:3888
  1. mkdir /var/bigdata/hadoop/zk<br /> echo 1 > /var/bigdata/hadoop/zk/myid <br /> vi /etc/profile
  1. export ZOOKEEPER_HOME=/opt/bigdata/zookeeper-3.4.6
  2. export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin
  1. source /etc/profile<br /> cd /opt/bigdata<br /> scp -r ./zookeeper-3.4.6 node03:`pwd`<br /> scp -r ./zookeeper-3.4.6 node04:`pwd`<br /> node03:<br /> mkdir /var/bigdata/hadoop/zk<br /> echo 2 > /var/bigdata/hadoop/zk/myid<br /> *环境变量<br /> . /etc/profile<br /> node04:<br /> mkdir /var/bigdata/hadoop/zk<br /> echo 3 > /var/bigdata/hadoop/zk/myid<br /> *环境变量<br /> . /etc/profile<br /> node02~node04:<br /> zkServer.sh start

3:配置

core-site.xml

  1. <property>
  2. <name>fs.defaultFS</name>
  3. <value>hdfs://mycluster</value>
  4. </property>
  5. <property>
  6. <name>ha.zookeeper.quorum</name>
  7. <value>node02:2181,node03:2181,node04:2181</value>
  8. </property>

hdfs-site.xml

  1. #以下是 一对多,逻辑到物理节点的映射
  2. <property>
  3. <name>dfs.nameservices</name>
  4. <value>mycluster</value>
  5. </property>
  6. <property>
  7. <name>dfs.ha.namenodes.mycluster</name>
  8. <value>nn1,nn2</value>
  9. </property>
  10. <property>
  11. <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  12. <value>node01:8020</value>
  13. </property>
  14. <property>
  15. <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  16. <value>node02:8020</value>
  17. </property>
  18. <property>
  19. <name>dfs.namenode.http-address.mycluster.nn1</name>
  20. <value>node01:50070</value>
  21. </property>
  22. <property>
  23. <name>dfs.namenode.http-address.mycluster.nn2</name>
  24. <value>node02:50070</value>
  25. </property>
  26. #以下是JN在哪里启动,数据存那个磁盘
  27. <property>
  28. <name>dfs.namenode.shared.edits.dir</name>
  29. <value>qjournal://node01:8485;node02:8485;node03:8485/mycluster</value>
  30. </property>
  31. <property>
  32. <name>dfs.journalnode.edits.dir</name>
  33. <value>/var/bigdata/hadoop/ha/dfs/jn</value>
  34. </property>
  35. #HA角色切换的代理类和实现方法,我们用的ssh免密
  36. <property>
  37. <name>dfs.client.failover.proxy.provider.mycluster</name>
  38. <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  39. </property>
  40. <property>
  41. <name>dfs.ha.fencing.methods</name>
  42. <value>sshfence</value>
  43. </property>
  44. <property>
  45. <name>dfs.ha.fencing.ssh.private-key-files</name>
  46. <value>/root/.ssh/id_dsa</value>
  47. </property>
  48. #开启自动化: 启动zkfc
  49. <property>
  50. <name>dfs.ha.automatic-failover.enabled</name>
  51. <value>true</value>
  52. </property>

分发配置: scp core-site.xml hdfs-site.xml node02:pwd
scp core-site.xml hdfs-site.xml node03:pwd
scp core-site.xml hdfs-site.xml node04:pwd

4:初始化启动

先启动JN hadoop-daemon.sh start journalnode
选择一个NN 做格式化:hdfs namenode -format <只有第一次搭建做,以后不用做>
启动这个格式化的NN ,以备另外一台同步 hadoop-daemon.sh start namenode
在另外一台机器中: hdfs namenode -bootstrapStandby
格式化zk: hdfs zkfc -formatZK <只有第一次搭建做,以后不用做>
start-dfs.sh

5:常用启动命令

  1. #启动namenode
  2. hadoop-daemon.sh start namenode
  3. #启动standby namenode
  4. hdfs namenode -bootstrapStandby
  5. #启动zkfc
  6. hadoop-daemon.sh start zkfc
  7. #停止服务
  8. stop-dfs.sh
  9. #启动服务
  10. start-dfs.sh

6:访问

http://node01:50070
image.png

http://node02:50070
image.png

7:验证

1)去看jn的日志和目录变化:
2)node04
zkCli.sh
ls /
启动之后可以看到锁:
get /hadoop-ha/mycluster/ActiveStandbyElectorLock
3)杀死namenode 杀死zkfc
kill -9 xxx
a)杀死active NN
b)杀死active NN身边的zkfc
c)shutdown activeNN 主机的网卡 : ifconfig eth0 down
2节点一直阻塞降级
如果恢复1上的网卡 ifconfig eth0 up
最终 2编程active