复制集

复制集的作用
典型的复制集结构
数据是如何复制的
通过选举完成故障恢复
影响选举的因素
复制集节点常见选配项
复制集注意事项
搭建复制集的操作流程

复制集的作用

主要意义：在于实现服务高可用。（一个节点出故障会有另一个节点出来替代）
实现依赖于两个方面的功能：
- 数据写入时将数据迅速复制到另一个独立节点上
- 在接受写入的节点发生故障时自动选举出一个新的替代节点
在实现高可用的同时，复制集实现了其他几个附加作用：
- 数据分发：将数据从一个区域复制到另一个区域，减少另一个区域的读延迟
- 读写分离：不同类型的压力分别在不同的节点上执行
- 异地容灾：在数据中心故障时快速切换到异地数据中心

典型的复制集结构

由3个以上具有投票权的节点组成，包括：
- 1个PRIMARY/主节点：接受写入操作和选举时投票
- 2个(或多个)SECONDARY/从节点：复制主节点上的数据和选举时投票
- 不推荐使用Arbiter（投票节点）
- 常见的3节点部署架构

数据是如何复制的

oplog概念（一个特别的集合）：当一个修改操作（增删改），到达主节点时，它对数据的操作将被记录下来（经过一些必要的转换），这些记录被称为oplog。
从节点通过在主节点上开一个tailable游标不断获取新进入主节点的oplog，并在自己的数据上回放，以此和主节点的数据一致。

通过选举完成故障恢复

具有投票权的节点之间两两互相发送心跳
当5次心跳未收到时判断为失联
如果失联的是主节点，从节点发起选举，选出新的主节点
如果是从节点失联则不会发起新的选举
选举基于 RAFT一致性算法 实现，选举成功的必要条件是大多数投票节点存活
复制集中最多可以有50个节点，但是具有投票权的节点最多7个

影响选举的因素

整个集群必须有大多数节点存活
被选举为主节点的节点必须：
- 能够与多数节点建立连接
- 具有较新的oplog
- 具有较高的优先级（如果有配置）

复制集节点常见选配项

是否具有投票权（v参数）：有则参与投票，默认都是有的。
优先级（priority参数）：优先级越高的节点越优先成为主节点。优先级为0的节点无法成为主节点。
隐藏（hidden参数）：复制数据，但对应用不可见。隐藏节点可以具有投票权，但优先级必须为0。
延迟（slaveDelay参数）：复制n秒之前的数据，与主节点保持时间差。

复制集注意事项

1. 关于硬件

正常的复制集节点都可能成为主节点，地位是一样的，所以硬件配置必须一致
为了保证节点不会同时宕机，节点使用的硬件必须具有独立性

2. 关于软件
复制集各节点软件版本必须一致，避免出现不可知问题

3. 增加节点不会增加系统写性能

搭建复制集的操作流程

单机，3节点复制集
步骤1：创建3个数据目录。MongoDB启动时将使用一个数据目录存放所有数据文件。
- mkdir -p /data/db{1,2,3}

步骤2：准备配置文件

复制集的每个mongodb进程应该位于不同服务器。单机运行3个进程，因此要各自为它们配置：
- 不同的端口
- 不同的数据目录：/data/db1
- 不同的日志文件路径： /data/db1/mongod.log

配置文件Linux/MacOS

# 放到 /data/db1/mongod.conf 也就是数据目录的mongod.conf文件
systemLog:
destination: file
path: /data/db1/mongod.log # 日志文件路径
logAppend: true
storage:
dbPath: /data/db1 # 数据目录
net:
bindIp: 0.0.0.0
port: 28017 # 端口
replication: # 这是个复制集
replSetName: rs0 # 复制集名称
processManagement: # windows这个配置可能无效
fork: true

mongod -f /db/db1/mongo.conf 启动3个进程
步骤3：配置复制集

$ mongo localhost:28017
# 方法1：
> rs.initiate()
> rs.add("0.0.0.0:28018") # hostname:port host需要能被解析
> rs.add("0.0.0.0:28019")
# 方法2
> rs.initiate({
    _id: "rs0",
  members: [{
      _id: 0,
    host: "0.0.0.0:28017"
  }, {
      _id: 1,
    host: "0.0.0.0:28018"
  }, {
      _id: 2,
    host: "0.0.0.0:28019"}]
})

复制集的作用

典型的复制集结构

数据是如何复制的

通过选举完成故障恢复

影响选举的因素

复制集节点常见选配项

复制集注意事项

1. 关于硬件

2. 关于软件

3. 增加节点不会增加系统写性能

搭建复制集的操作流程