复制集的作用

  • 主要意义:在于实现服务高可用。(一个节点出故障会有另一个节点出来替代)
  • 实现依赖于两个方面的功能:

    • 数据写入时将数据迅速复制到另一个独立节点上
    • 在接受写入的节点发生故障时自动选举出一个新的替代节点
  • 在实现高可用的同时,复制集实现了其他几个附加作用:

    • 数据分发:将数据从一个区域复制到另一个区域,减少另一个区域的读延迟
    • 读写分离:不同类型的压力分别在不同的节点上执行
    • 异地容灾:在数据中心故障时快速切换到异地数据中心

典型的复制集结构

  • 由3个以上具有投票权的节点组成,包括:

    • 1个PRIMARY/主节点:接受写入操作和选举时投票
    • 2个(或多个)SECONDARY/从节点:复制主节点上的数据和选举时投票
    • 不推荐使用Arbiter(投票节点)
    • 常见的3节点部署架构

      image.png

数据是如何复制的

  • oplog概念(一个特别的集合):当一个修改操作(增删改),到达主节点时,它对数据的操作将被记录下来(经过一些必要的转换),这些记录被称为oplog。
  • 从节点通过在主节点上开一个tailable游标不断获取新进入主节点的oplog,并在自己的数据上回放,以此和主节点的数据一致。
    image.png

通过选举完成故障恢复

  • 具有投票权的节点之间两两互相发送心跳
  • 当5次心跳未收到时判断为失联
  • 如果失联的是主节点,从节点发起选举,选出新的主节点
  • 如果是从节点失联则不会发起新的选举
  • 选举基于 RAFT一致性算法 实现,选举成功的必要条件是大多数投票节点存活
  • 复制集中最多可以有50个节点,但是具有投票权的节点最多7个

image.png

影响选举的因素

  • 整个集群必须有大多数节点存活
  • 被选举为主节点的节点必须:
    • 能够与多数节点建立连接
    • 具有较新的oplog
    • 具有较高的优先级(如果有配置)

复制集节点常见选配项

  • 是否具有投票权(v参数):有则参与投票,默认都是有的。
  • 优先级(priority参数):优先级越高的节点越优先成为主节点。优先级为0的节点无法成为主节点。
  • 隐藏(hidden参数):复制数据,但对应用不可见。隐藏节点可以具有投票权,但优先级必须为0。
  • 延迟(slaveDelay参数):复制n秒之前的数据,与主节点保持时间差。

复制集注意事项

1. 关于硬件

  • 正常的复制集节点都可能成为主节点,地位是一样的,所以硬件配置必须一致
  • 为了保证节点不会同时宕机,节点使用的硬件必须具有独立性

    2. 关于软件

  • 复制集各节点软件版本必须一致,避免出现不可知问题

    3. 增加节点不会增加系统写性能

搭建复制集的操作流程

  • 单机,3节点复制集
  • 步骤1:创建3个数据目录。MongoDB启动时将使用一个数据目录存放所有数据文件。
    • mkdir -p /data/db{1,2,3}
  • 步骤2:准备配置文件

    • 复制集的每个mongodb进程应该位于不同服务器。单机运行3个进程,因此要各自为它们配置:
      • 不同的端口
      • 不同的数据目录 :/data/db1
      • 不同的日志文件路径: /data/db1/mongod.log
    • 配置文件Linux/MacOS
      1. # 放到 /data/db1/mongod.conf 也就是数据目录的mongod.conf文件
      2. systemLog:
      3. destination: file
      4. path: /data/db1/mongod.log # 日志文件路径
      5. logAppend: true
      6. storage:
      7. dbPath: /data/db1 # 数据目录
      8. net:
      9. bindIp: 0.0.0.0
      10. port: 28017 # 端口
      11. replication: # 这是个复制集
      12. replSetName: rs0 # 复制集名称
      13. processManagement: # windows这个配置可能无效
      14. fork: true
  • mongod -f /db/db1/mongo.conf 启动3个进程

  • 步骤3:配置复制集
  1. $ mongo localhost:28017
  2. # 方法1:
  3. > rs.initiate()
  4. > rs.add("0.0.0.0:28018") # hostname:port host需要能被解析
  5. > rs.add("0.0.0.0:28019")
  6. # 方法2
  7. > rs.initiate({
  8. _id: "rs0",
  9. members: [{
  10. _id: 0,
  11. host: "0.0.0.0:28017"
  12. }, {
  13. _id: 1,
  14. host: "0.0.0.0:28018"
  15. }, {
  16. _id: 2,
  17. host: "0.0.0.0:28019"}]
  18. })