复制集的作用
- 主要意义:在于实现服务高可用。(一个节点出故障会有另一个节点出来替代)
实现依赖于两个方面的功能:
- 数据写入时将数据迅速复制到另一个独立节点上
- 在接受写入的节点发生故障时自动选举出一个新的替代节点
在实现高可用的同时,复制集实现了其他几个附加作用:
- 数据分发:将数据从一个区域复制到另一个区域,减少另一个区域的读延迟
- 读写分离:不同类型的压力分别在不同的节点上执行
- 异地容灾:在数据中心故障时快速切换到异地数据中心
典型的复制集结构
由3个以上具有投票权的节点组成,包括:
- 1个PRIMARY/主节点:接受写入操作和选举时投票
- 2个(或多个)SECONDARY/从节点:复制主节点上的数据和选举时投票
- 不推荐使用Arbiter(投票节点)
常见的3节点部署架构
数据是如何复制的
- oplog概念(一个特别的集合):当一个修改操作(增删改),到达主节点时,它对数据的操作将被记录下来(经过一些必要的转换),这些记录被称为oplog。
- 从节点通过在主节点上开一个tailable游标不断获取新进入主节点的oplog,并在自己的数据上回放,以此和主节点的数据一致。
通过选举完成故障恢复
- 具有投票权的节点之间两两互相发送心跳
- 当5次心跳未收到时判断为失联
- 如果失联的是主节点,从节点发起选举,选出新的主节点
- 如果是从节点失联则不会发起新的选举
- 选举基于 RAFT一致性算法 实现,选举成功的必要条件是大多数投票节点存活
- 复制集中最多可以有50个节点,但是具有投票权的节点最多7个
影响选举的因素
- 整个集群必须有大多数节点存活
- 被选举为主节点的节点必须:
- 能够与多数节点建立连接
- 具有较新的oplog
- 具有较高的优先级(如果有配置)
复制集节点常见选配项
- 是否具有投票权(v参数):有则参与投票,默认都是有的。
- 优先级(priority参数):优先级越高的节点越优先成为主节点。优先级为0的节点无法成为主节点。
- 隐藏(hidden参数):复制数据,但对应用不可见。隐藏节点可以具有投票权,但优先级必须为0。
- 延迟(slaveDelay参数):复制n秒之前的数据,与主节点保持时间差。
复制集注意事项
1. 关于硬件
搭建复制集的操作流程
- 单机,3节点复制集
- 步骤1:创建3个数据目录。MongoDB启动时将使用一个数据目录存放所有数据文件。
mkdir -p /data/db{1,2,3}
步骤2:准备配置文件
- 复制集的每个mongodb进程应该位于不同服务器。单机运行3个进程,因此要各自为它们配置:
- 不同的端口
- 不同的数据目录 :
/data/db1
- 不同的日志文件路径:
/data/db1/mongod.log
- 配置文件Linux/MacOS
# 放到 /data/db1/mongod.conf 也就是数据目录的mongod.conf文件
systemLog:
destination: file
path: /data/db1/mongod.log # 日志文件路径
logAppend: true
storage:
dbPath: /data/db1 # 数据目录
net:
bindIp: 0.0.0.0
port: 28017 # 端口
replication: # 这是个复制集
replSetName: rs0 # 复制集名称
processManagement: # windows这个配置可能无效
fork: true
- 复制集的每个mongodb进程应该位于不同服务器。单机运行3个进程,因此要各自为它们配置:
mongod -f /db/db1/mongo.conf
启动3个进程- 步骤3:配置复制集
$ mongo localhost:28017
# 方法1:
> rs.initiate()
> rs.add("0.0.0.0:28018") # hostname:port host需要能被解析
> rs.add("0.0.0.0:28019")
# 方法2
> rs.initiate({
_id: "rs0",
members: [{
_id: 0,
host: "0.0.0.0:28017"
}, {
_id: 1,
host: "0.0.0.0:28018"
}, {
_id: 2,
host: "0.0.0.0:28019"}]
})