缘起
最近阅读 [云原生分布式存储基石:etcd深入解析] (杜军 , 2019.1)
本系列笔记拟采用golang练习之
gitee: https://gitee.com/ioly/learning.gooop
raft分布式一致性算法
分布式存储系统通常会通过维护多个副本来进行容错,以提高系统的可用性。这就引出了分布式存储系统的核心问题——如何保证多个副本的一致性?Raft算法把问题分解成了领袖选举(leader election)、日志复制(log replication)、安全性(safety)和成员关系变化(membership changes)这几个子问题。Raft算法的基本操作只需2种RPC即可完成。RequestVote RPC是在选举过程中通过旧的Leader触发的,AppendEntries RPC是领导人触发的,目的是向其他节点复制日志条目和发送心跳(heartbeat)。
目标
- 根据raft协议,实现高可用分布式强一致的kv存储
子目标(Day 2)
- 定义raft rpc接口
- 定义raft lsm有限状态自动机接口(状态模式)
设计
- config/IRaftConfig.go: 集群配置接口。简单起见, 使用静态配置模式定义节点数量和地址。
- config/IRaftNodeConfig.go: 节点配置接口
- roles/roles.go:raft三种角色常量
- timeout/timeout.go:超时时间常量
- rpc/IRaftRPC.go: raft协议的基本RPC接口及参数定义。简单起见,拟采用net/rpc实现之。
- rpc/IRaftRPCServer.go: 支持raft协议的服务器接口。简单起见,拟采用net/rpc实现之。
- lsm/IRaftLSM.go: raft有限状态机接口
- lsm/IRaftState.go: 状态接口
- lsm/tRaftStateBase.go: 基本状态数据
- lsm/tFollowerState: follower状态的实现,未完成
config/IRaftConfig.go
集群配置接口。简单起见, 使用静态配置模式定义节点数量和地址。
package configtype IRaftConfig interface {ID() stringNodes() []IRaftNodeConfig}
config/IRaftNodeConfig.go
节点配置接口
package configtype IRaftNodeConfig interface {ID() stringEndpoint() string}
roles/roles.go
raft三种角色常量
package rolestype RaftRole intconst Follower RaftRole = 1const Candidate RaftRole = 2const Leader RaftRole = 3
timeout/timeout.go
超时时间常量
package timeoutimport "time"const HeartbeatInterval = 150 * time.Millisecondconst HeartbeatTimeout = 5 * HeartbeatIntervalconst ElectionTimeout = HeartbeatTimeout
rpc/IRaftRPC.go
raft协议的基本RPC接口及参数定义。简单起见,拟采用net/rpc实现之。
package rpctype IRaftRPC interface {RequestVote(cmd *RequestVoteCmd, ret *RequestVoteRet) errorAppendEntries(cmd *AppendEntriesCmd, ret *AppendEntriesRet) error}type RequestVoteCmd struct {CandidateID stringTerm intLastLogIndex intLastLogTerm int}type RequestVoteRet struct {Term intVoteGranted bool}type AppendEntriesCmd struct {Term intLeaderID stringPrevLogTerm intPrevLogIndex intLeaderCommit intEntries []*LogEntry}type LogEntry struct {Tag intContent []byte}type AppendEntriesRet struct {Term intSuccess bool}
rpc/IRaftRPCServer.go
支持raft协议的服务器接口。简单起见,拟采用net/rpc实现之。
package rpctype IRaftRPCServer interface {BeginServeTCP(port int, r IRaftRPC)}
lsm/IRaftLSM.go
raft有限状态机接口
package lsmimport "learning/gooop/etcd/raft/rpc"// IRaftLSM raft有限状态自动机type IRaftLSM interface {rpc.IRaftRPCState() IRaftState}
lsm/IRaftState.go
状态接口
package lsmimport ("learning/gooop/etcd/raft/roles""learning/gooop/etcd/raft/rpc")type IRaftState interface {rpc.IRaftRPCRole() roles.RaftRoleStart()}
lsm/tRaftStateBase.go
基本状态数据
package lsmimport ("learning/gooop/etcd/raft/config""learning/gooop/etcd/raft/roles")//type tRaftStateBase struct {// 当前角色role roles.RaftRole// 当前任期号term int// leader.idleaderID string// 集群配置cfg config.IRaftConfig}func newRaftStateBase(term int, cfg config.IRaftConfig) *tRaftStateBase {it := new(tRaftStateBase)it.init(term, cfg)return it}// init initialize self, with term and config specifiedfunc (me *tRaftStateBase) init(term int, cfg config.IRaftConfig) {me.cfg = cfgme.role = roles.Followerme.term = termme.leaderID = ""}func (me *tRaftStateBase) Role() roles.RaftRole {return me.role}
lsm/tFollowerState
follower状态的实现,未完成
package lsmimport ("learning/gooop/etcd/raft/config""learning/gooop/etcd/raft/timeout""sync""time")type tFollowerState struct {tRaftStateBasemInitOnce sync.OncemStartOnce sync.OncemEventMap map[tFollowerEvent][]tFollowerEventHandler}type tFollowerEvent intconst evStart tFollowerEvent = 1type tFollowerEventHandler func(e tFollowerEvent, args ...interface{})func newFollowerState(term int, cfg config.IRaftConfig) *tFollowerState {it := new(tFollowerState)it.init(term, cfg)// todo: to implement IRaftStatereturn it}func (me *tFollowerState) init(term int, cfg config.IRaftConfig) {me.mInitOnce.Do(func() {me.tRaftStateBase = *newRaftStateBase(term, cfg)// init event mapme.mEventMap = make(map[tFollowerEvent][]tFollowerEventHandler)me.registerEventHandlers()})}func (me *tFollowerState) registerEventHandlers() {me.mEventMap[evStart] = []tFollowerEventHandler{me.afterStartThenBeginWatchLeaderTimeout,}}func (me *tFollowerState) raise(e tFollowerEvent, args ...interface{}) {if handlers, ok := me.mEventMap[e]; ok {for _, it := range handlers {it(e, args...)}}}func (me *tFollowerState) Start() {me.mStartOnce.Do(func() {me.raise(evStart)})}func (me *tFollowerState) afterStartThenBeginWatchLeaderTimeout(e tFollowerEvent, args ...interface{}) {go func() {iCheckingTimeoutInterval := timeout.HeartbeatTimeout / 3for range time.Tick(iCheckingTimeoutInterval) {// todo: watch leader.AppendEntries rpc timeout}}()}
(未完待续)
