Redis 主从
Redis是开源的key-value存储系统,可作为数据库、缓存、消息组件。
Redis的作者是Salvatore Sanfilippo(网名为antirez),他在2009年开发完成并开源了Redis。
Redis由于性能极高、功能强大,迅速在业界流行,现已成为高并发系统中最常用的组件之一。
Redis提供了多种类型的数据结构,如字符串(String)、散列(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set)等。
Redis还是分布式系统,主从集群可以实现数据热备份,哨兵(Sentinel)机制可以保证主从集群高可用,Cluster集群则提供了水平扩展的能力。
Redis还提供了持久化、Lua脚本、Module模块、Stream消息流、Tracking机制等一系统强大功能,适用于各种业务场景。
Redis是一个典型的“小而美”的程序。
Redis实现简单,源码非常优雅简洁,阅读起来并不吃力,而且Redis功能齐全,涵盖了数据存储、分布式、消息流等众多特性,非常值得深入学习。
Redis中的一个重要概念就是主从复制机制。
下面详细分析Redis主从复制机制中主从握手的过程。
Redis主从复制机制中有两个角色:主节点与从节点。
主节点处理用户请求,并将数据复制给从节点。
主从复制机制主要有以下作用:
(1)数据冗余,将数据热备份到从节点,即使主节点由于磁盘损坏丢失数据,从节点依然保留数据副本。
(2)读/写分离,可以由主节点提供写服务,从节点提供读服务,提高Redis服务整体吞吐量。
(3)故障恢复,主节点故障下线后,可以手动将从节点切换为主节点,继续提供服务。
(4)高可用基础,主从复制机制是Sentinel和Cluster机制的基础,Sentinel和Cluster都实现了故障转移,即主节点故障停止后,Redis负责选择一个从节点切换为主节点,继续提供服务。
下面将主从复制流程分为三个阶段。
(1)握手阶段:主从连接成功后,从节点需要将自身信息(如IP地址、端口等)发送给主节点,以便主节点能认识自己。
(2)同步阶段:从节点连接主节点后,需要先同步数据,数据达到一致(或者只有最新的变更不一致)后才进入复制阶段。
Redis支持两种同步机制:
- 全量同步:从节点发送命令PSYNC ? -1,要求进行全量同步,主节点返回响应+FULLRESYNC,表明同意全量同步。随后,主节点生成RDB数据并发送给从节点。这种方式常用于新的从节点首次同步数据。
- 部分同步:从节点发送命令
PSYNC replid offset
,要求进行部分同步,主节点响应+CONTINUE,表明同意部分同步。主节点只需要把复制积压区中offset
偏移量之后的命令发送给从节点即可(主节点会将执行的写命令都写入复制积压区)。这种方式常用于主从连接断开重连时同步数据。如果offset不在复制积压区中,那么主节点也会返回+FULLRESYNC
,要求进行全量同步。
(3)复制阶段:主节点在运行期间,将执行的写命令传播给从节点,从节点接收并执行这些命令,从而达到复制数据的效果。Redis使用的是异步复制,主节点传播命令后,并不会等待从节点返回ACK确认。异步复制的优点是低延迟和高性能,缺点是可能在短期内主从节点数据不一致。
本文中指的命令,包含命令名及执行命令的参数。
PSYNC命令涉及以下属性:
server.master_repl_offset
:记录当前服务器已执行命令的偏移量。server.replid
:40位十六进制的随机字符串,在主节点中是自身ID,在从节点中记录的是主节点ID。server.replid2
:用于主节点,存放上一个主节点ID。server.repl_backlog
:复制积压区,主节点将最近执行的写命令写入复制积压区,用于实现部分同步。下面介绍一下Redis主从握手流程。
主从复制的机制是由从节点发起流程,可以发送REPLICAOF命令到某个服务器,要求它成为指定服务器的从节点:
REPLICAOF <masterip> <masterport>
或者在配置文件中添加配置
REPLICAOF <masterip> <masterport>
,这样Redis服务器启动后将成为指定服务器的从节点。
提示:从Redis 5开始为SLAVEOF
命令提供别名REPLICAOF
,这两个命令的作用一样。下面以从节点的视角,分析主从握手的过程。
从节点握手阶段涉及以下属性。
server.repl_state
:用于从节点,标志从节点当前复制状态。有如下值:REPL_STATE_NONE
:无主从复制关系。REPL_STATE_CONNECT
:待连接。REPL_STATE_CONNECTING
:正在连接。- …(部分握手状态并没有列出)
REPL_STATE_TRANSFER
:从节点正在接收RDB数据。REPL_STATE_CONNECTED
:已连接,主从同步完成。
从节点使用replicaofCommand
函数处理REPLICAOF
命令。
该函数执行如下逻辑:
(1)如果处理的命令是REPLICAOF NO ONE
,则将当前服务器转换为主节点,取消原来的主从复制关系,退出函数。
(2)调用replicationSetMaster
函数,与给定服务器建立主从复制关系。
另外,在配置文件中配置REPLICAOF <masterip> <masterport>
,Redis加载该配置,也会将server.repl_state
设置为REPL_STATE_CONNECT
状态(config.c)。
从节点server.repl_state
进入REPL_STATE_CONNECT
状态后,主从复制流程已经开始。serverCron
时间事件负责对REPL_STATE_CONNECT
状态进行处理:
int serverCron(struct aeEventLoop *eventLoop, long long id, void *clientData) {
...
if (server.repl_state == REPL_STATE_CONNECT) {
if (connectWithMaster() == C_OK) {
serverLog(LL_NOTICE,"MASTER <-> REPLICA sync started");
}
}
}
调用connectWithMaster
函数进行处理,该函数负责建立主从网络连接:
int connectWithMaster(void) {
// [1]
server.repl_transfer_s = server.tls_replication ? connCreateTLS() : connCreateSocket();
// [2]
if (connConnect(server.repl_transfer_s, server.masterhost, server.masterport,
NET_FIRST_BIND_ADDR, syncWithMaster) == C_ERR) {
...
return C_ERR;
}
// [3]
server.repl_transfer_lastio = server.unixtime;
server.repl_state = REPL_STATE_CONNECTING;
return C_OK;
}
【1】创建一个Socket
套接字。connCreateTLS
函数创建TLS连接,connCreateSocket
函数创建TCP连接,它们都返回套接字文件描述符。该连接是主从节点网络通信的连接,称之为主从连接。
【2】connConnect
函数负责连接到主节点,并且在连接成功后调用syncWithMaster
函数。
【3】从节点server.repl_state
进入REPL_STATE_CONNECTING
状态。
网络连接成功后,从节点调用syncWithMaster
函数,进入握手阶段:
void syncWithMaster(connection *conn) {
char tmpfile[256], *err = NULL;
int dfd = -1, maxtries = 5;
int psync_result;
...
// [1]
if (server.repl_state == REPL_STATE_CONNECTING) {
connSetReadHandler(conn, syncWithMaster);
connSetWriteHandler(conn, NULL);
server.repl_state = REPL_STATE_RECEIVE_PONG;
err = sendSynchronousCommand(SYNC_CMD_WRITE,conn,"PING",NULL);
if (err) goto write_error;
return;
}
...
// [2]
if (server.repl_state != REPL_STATE_RECEIVE_PSYNC) {
goto error;
}
// more
}
【1】根据server.repl_state
状态,执行对应操作。
从节点发送给主节点的信息,主节点会记录在从节点客户端,并在INFO命令中输出这些信息。另外,Sentinel模块需要从主节点INFO命令响应中获取这些从节点信息。
【2】执行到这里,主从握手阶段已经完成。server.repl_state
必须处于REPL_STATE_RECEIVE_PSYNC
状态,否则报错。
下面使用Linux tcpdump工具抓取主从连接报文,分析主从节点握手阶段的通信内容(主节点端口为6000):
tcpdump tcp -i lo -nn port 6000 -T RESP
tcpdump支持RESP协议,最后一个选项-T
RESP要求tcpdump以RESP协议格式解析报文。
其中6000端口为主节点端口,60374端口为从节点通信端口。从tcpdump的输出可以清晰地看到主从节点在握手阶段的通信内容。
提示:tcpdump解析后的RESP内容并不会展示数据类型的标志符,如主节点对从节点PING
命令的响应实际上是“-NOAUTH Authentication required.”,请阅读源码时注意。
以主节点视角分析握手阶段,主节点不断处理来自从节点的命令(包括PING
、AUTH
、REPLCONF
),感兴趣可自行阅读代码。