如何理解日志?

副本数据是以日志的形式存在的,日志是由日志项组成.

日志项

日志项是一种数据格式,它主要包含:

  • 指令(Command): 一条由客户端请求指定的、状态机需要执行的指令。你可以将指令理解成客户端指定的数据
  • 附加信息
    • 索引值(Log index): 日志项对应的整数索引值。它其实就是用来标识日志项的,是一个连续的、单调递增的整数号码。
    • 任期编号(Term): 创建这条日志项的领导者的任期编号

image.png

如何复制日志?

你可以把 Raft 的日志复制理解成一个优化后的二阶段提交(将二阶段优化成了一阶段),减少了一半的往返消息,也就是降低了一半的消息延迟。

  1. 首先,领导者进入第一阶段,通过日志复制(AppendEntries)RPC 消息,将日志项复制到集群其他节点上。
  2. 接着,如果领导者接收到大多数的“复制成功”响应后,它将日志项应用到它的状态机,并返回成功给客户端。如果领导者没有接收到大多数的“复制成功”响应,那么就返回错误给客户端。

跟随者自动应用领导者发送来的日志项.

image.png

如何实现日志的一致?

在 Raft 算法中,领导者通过强制跟随者直接复制自己的日志项,处理不一致日志。也就是说,Raft 是通过以领导者的日志为准,来实现各节点日志的一致的。具体有 2 个步骤。

  1. 首先,领导者通过日志复制 RPC 的一致性检查,找到跟随者节点上,与自己相同日志项的最大索引值。也就是说,这个索引值之前的日志,领导者和跟随者是一致的,之后的日志是不一致的了。
  2. 然后,领导者强制跟随者更新覆盖的不一致日志项,实现日志的一致。

image.png