选举机制

CAP

CAP法则,强一致性、高可用性、分区容错性。
zookeeper符合强一致性、高可用性。

选举机制

1.半数机制:集群中半数以上机器存活,集群可用,所以zookeeper适合安装奇数台服务器。
2.zookeeper中配置没有指定leader和follower。但是工作的时候有一个节点是leader,其他是follower,是通过选举机制产生的。

选举过程分析:

假设有五台服务器组成的Zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都是一样的。假设这些服务器依序启动,来看看会发生什么。
image.png
(1)服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING;
(2)服务器2启动,再发起一次选举。服务器1和2分别投自己一票并交换选票信息:此时服务器1发现服务器2的ID比自己目前投票推举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1,2状态保持LOOKING
(3)服务器3启动,发起一次选举。此时服务器1和2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选Leader。服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING;
(4)服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为FOLLOWING;
(5)服务器5启动,同4一样当小弟。

Paxos算法

分布式系统中的节点通信存在两种模型:共享内存(Shared memory)和消息传递(Messages passing)。基于消息传递通信模型的分布式系统,不可避免的会发生以下错误:进程可能会慢、被杀死或者重启,消息可能会延迟、丢失、重复,在基础 Paxos 场景中,先不考虑可能出现消息篡改即拜占庭错误的情况。Paxos 算法解决的问题是在一个可能发生上述异常的分布式系统中如何就某个值达成一致,保证不论发生以上任何异常,都不会破坏决议的一致性。
Paxos算法一种基于消息传递且具有高度容错特性的一致性算法。
image.png
paxos算法流程每条消息描述如下:

  1. 准备阶段
    1. 发送准备请求(携带proposerID)。Proposer生成全局唯一且递增的ProposalID(可使用时间戳加ServerID),向所有Acceptors发送Prepare请求,这里无需携带提案内容,只携带ProposalID即可。
    2. 做出承诺。acceptors收到prepare请求后,做出两个承诺,一个应答。
      1. 两个承诺1:不在接收proposalID小于等于当前请求的prepare请求。
      2. 两个承诺2:不再接受proposalID小于当前请求的propose请求。
      3. 一个应答:不违背以前做出的承诺下,回复已经accept过的提案中proposalID最大的那个提案的value和proposalID,没有则返回空值。
  2. 接受阶段
    1. 发送propose提案:proposer收到多数Acceptors的promise应答后,从应答中选择proposalID最大的提案的value,作为本次要发起的提案。如果所有应答的提案value均为空值,则可以自己随意决定提案Value。然后携带当前proposalID,向所有acceptors发送propose请求。
    2. 接收提案:acceptor接收propose请求后,在不违背自己做出的承诺下,接受并持久化当前proposalID和提案value。
  3. learn阶段
    1. learn:proposer收到多数acceptors的accept后,决议形成,将形成的决议发送给所有learners。

缺陷:
在网络复杂的情况下,一个应用paxos算法的分布式系统,可能很久无法收敛,甚至陷入活锁的情况。
image.png
造成这样的原因是:有一个以上的proposer,多个proposer相互争夺acceptors,造成无法达成一致的情况,针对这种情况,一种改进的paxos算法被提出:从系统中选出一个节点作为leader,只有leader能够发起提案。这样,一次paxos流程中只有一个proposer,不会出现活锁的情况。即zk中的选举机制

应用场景

统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。