Redis 主从
Redis是开源的key-value存储系统,可作为数据库、缓存、消息组件。
Redis的作者是Salvatore Sanfilippo(网名为antirez),他在2009年开发完成并开源了Redis。
Redis由于性能极高、功能强大,迅速在业界流行,现已成为高并发系统中最常用的组件之一。
Redis提供了多种类型的数据结构,如字符串(String)、散列(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set)等。
Redis还是分布式系统,主从集群可以实现数据热备份,哨兵(Sentinel)机制可以保证主从集群高可用,Cluster集群则提供了水平扩展的能力。
Redis还提供了持久化、Lua脚本、Module模块、Stream消息流、Tracking机制等一系统强大功能,适用于各种业务场景。

Redis是一个典型的“小而美”的程序。

Redis实现简单,源码非常优雅简洁,阅读起来并不吃力,而且Redis功能齐全,涵盖了数据存储、分布式、消息流等众多特性,非常值得深入学习。
Redis中的一个重要概念就是主从复制机制。

下面详细分析Redis主从复制机制中主从握手的过程。

Redis主从复制机制中有两个角色:主节点与从节点。
主节点处理用户请求,并将数据复制给从节点。

主从复制机制主要有以下作用:

(1)数据冗余,将数据热备份到从节点,即使主节点由于磁盘损坏丢失数据,从节点依然保留数据副本。
(2)读/写分离,可以由主节点提供写服务,从节点提供读服务,提高Redis服务整体吞吐量。
(3)故障恢复,主节点故障下线后,可以手动将从节点切换为主节点,继续提供服务。
(4)高可用基础,主从复制机制是Sentinel和Cluster机制的基础,Sentinel和Cluster都实现了故障转移,即主节点故障停止后,Redis负责选择一个从节点切换为主节点,继续提供服务。

下面将主从复制流程分为三个阶段。

(1)握手阶段:主从连接成功后,从节点需要将自身信息(如IP地址、端口等)发送给主节点,以便主节点能认识自己。
(2)同步阶段:从节点连接主节点后,需要先同步数据,数据达到一致(或者只有最新的变更不一致)后才进入复制阶段。
Redis支持两种同步机制:

  • 全量同步:从节点发送命令PSYNC ? -1,要求进行全量同步,主节点返回响应+FULLRESYNC,表明同意全量同步。随后,主节点生成RDB数据并发送给从节点。这种方式常用于新的从节点首次同步数据。
  • 部分同步:从节点发送命令PSYNC replid offset,要求进行部分同步,主节点响应+CONTINUE,表明同意部分同步。主节点只需要把复制积压区中offset偏移量之后的命令发送给从节点即可(主节点会将执行的写命令都写入复制积压区)。这种方式常用于主从连接断开重连时同步数据。如果offset不在复制积压区中,那么主节点也会返回+FULLRESYNC,要求进行全量同步。

(3)复制阶段:主节点在运行期间,将执行的写命令传播给从节点,从节点接收并执行这些命令,从而达到复制数据的效果。Redis使用的是异步复制,主节点传播命令后,并不会等待从节点返回ACK确认。异步复制的优点是低延迟和高性能,缺点是可能在短期内主从节点数据不一致。
本文中指的命令,包含命令名及执行命令的参数。

PSYNC命令涉及以下属性:

  • server.master_repl_offset:记录当前服务器已执行命令的偏移量。
  • server.replid:40位十六进制的随机字符串,在主节点中是自身ID,在从节点中记录的是主节点ID。
  • server.replid2:用于主节点,存放上一个主节点ID。
  • server.repl_backlog:复制积压区,主节点将最近执行的写命令写入复制积压区,用于实现部分同步。

    下面介绍一下Redis主从握手流程。

    主从复制的机制是由从节点发起流程,可以发送REPLICAOF命令到某个服务器,要求它成为指定服务器的从节点:

    1. REPLICAOF <masterip> <masterport>

    或者在配置文件中添加配置REPLICAOF <masterip> <masterport>,这样Redis服务器启动后将成为指定服务器的从节点。
    提示:从Redis 5开始为SLAVEOF命令提供别名REPLICAOF,这两个命令的作用一样。

    下面以从节点的视角,分析主从握手的过程。

    从节点握手阶段涉及以下属性。
    server.repl_state:用于从节点,标志从节点当前复制状态。有如下值:

  • REPL_STATE_NONE:无主从复制关系。

  • REPL_STATE_CONNECT:待连接。
  • REPL_STATE_CONNECTING:正在连接。
  • …(部分握手状态并没有列出)
  • REPL_STATE_TRANSFER:从节点正在接收RDB数据。
  • REPL_STATE_CONNECTED:已连接,主从同步完成。

从节点使用replicaofCommand函数处理REPLICAOF命令。

该函数执行如下逻辑:

(1)如果处理的命令是REPLICAOF NO ONE,则将当前服务器转换为主节点,取消原来的主从复制关系,退出函数。
(2)调用replicationSetMaster函数,与给定服务器建立主从复制关系。
另外,在配置文件中配置REPLICAOF <masterip> <masterport>,Redis加载该配置,也会将server.repl_state设置为REPL_STATE_CONNECT状态(config.c)。
从节点server.repl_state进入REPL_STATE_CONNECT状态后,主从复制流程已经开始。
serverCron时间事件负责对REPL_STATE_CONNECT状态进行处理:

  1. int serverCron(struct aeEventLoop *eventLoop, long long id, void *clientData) {
  2. ...
  3. if (server.repl_state == REPL_STATE_CONNECT) {
  4. if (connectWithMaster() == C_OK) {
  5. serverLog(LL_NOTICE,"MASTER <-> REPLICA sync started");
  6. }
  7. }
  8. }

调用connectWithMaster函数进行处理,该函数负责建立主从网络连接:

  1. int connectWithMaster(void) {
  2. // [1]
  3. server.repl_transfer_s = server.tls_replication ? connCreateTLS() : connCreateSocket();
  4. // [2]
  5. if (connConnect(server.repl_transfer_s, server.masterhost, server.masterport,
  6. NET_FIRST_BIND_ADDR, syncWithMaster) == C_ERR) {
  7. ...
  8. return C_ERR;
  9. }
  10. // [3]
  11. server.repl_transfer_lastio = server.unixtime;
  12. server.repl_state = REPL_STATE_CONNECTING;
  13. return C_OK;
  14. }

【1】创建一个Socket套接字。connCreateTLS函数创建TLS连接,connCreateSocket函数创建TCP连接,它们都返回套接字文件描述符。该连接是主从节点网络通信的连接,称之为主从连接。
【2】connConnect函数负责连接到主节点,并且在连接成功后调用syncWithMaster函数。
【3】从节点server.repl_state进入REPL_STATE_CONNECTING状态。
网络连接成功后,从节点调用syncWithMaster函数,进入握手阶段:

  1. void syncWithMaster(connection *conn) {
  2. char tmpfile[256], *err = NULL;
  3. int dfd = -1, maxtries = 5;
  4. int psync_result;
  5. ...
  6. // [1]
  7. if (server.repl_state == REPL_STATE_CONNECTING) {
  8. connSetReadHandler(conn, syncWithMaster);
  9. connSetWriteHandler(conn, NULL);
  10. server.repl_state = REPL_STATE_RECEIVE_PONG;
  11. err = sendSynchronousCommand(SYNC_CMD_WRITE,conn,"PING",NULL);
  12. if (err) goto write_error;
  13. return;
  14. }
  15. ...
  16. // [2]
  17. if (server.repl_state != REPL_STATE_RECEIVE_PSYNC) {
  18. goto error;
  19. }
  20. // more
  21. }

【1】根据server.repl_state状态,执行对应操作。
从节点发送给主节点的信息,主节点会记录在从节点客户端,并在INFO命令中输出这些信息。另外,Sentinel模块需要从主节点INFO命令响应中获取这些从节点信息。
【2】执行到这里,主从握手阶段已经完成。server.repl_state必须处于REPL_STATE_RECEIVE_PSYNC状态,否则报错。
下面使用Linux tcpdump工具抓取主从连接报文,分析主从节点握手阶段的通信内容(主节点端口为6000):

  1. tcpdump tcp -i lo -nn port 6000 -T RESP

tcpdump支持RESP协议,最后一个选项-T RESP要求tcpdump以RESP协议格式解析报文。
其中6000端口为主节点端口,60374端口为从节点通信端口。从tcpdump的输出可以清晰地看到主从节点在握手阶段的通信内容。
提示:tcpdump解析后的RESP内容并不会展示数据类型的标志符,如主节点对从节点PING命令的响应实际上是“-NOAUTH Authentication required.”,请阅读源码时注意。
以主节点视角分析握手阶段,主节点不断处理来自从节点的命令(包括PINGAUTHREPLCONF),感兴趣可自行阅读代码。