Redis 持久化机制的意义

Redis 如果只是把数据放在内存中是没有办法应对一些灾难性的故障的,比如机房停机,停电等。一旦出现灾难性故障的时候,就会丢失所有数据。

如果通过持久化将数据备份到磁盘上去,然后定期同步和备份到一些云存储服务上去,就可以保证不会丢失全部数据,还是可以恢复大部分数据的。

Redis 持久化的意义就是用来做数据备份和故障恢复的。

Redis 持久化机制的原理

RDB 和 AOF 两种持久化机制的介绍

RDB 持久化机制,对 Redis 中的数据进行周期性的持久化 ,RDB 的执行步骤:

  1. Redis 调用系统函数 fork() ,创建一个子进程;
  2. 子进程将数据集写入到一个临时 RDB 文件中;
  3. 当子进程完成对临时 RDB 文件的写入时,Redis 用新的临时 RDB 文件替换原来的 RDB 文件,并删除旧 RDB 文件;

AOF 持久化机制,对每条写入命令作为日志,以 append-only 的模式写入一个日志文件中,在 Redis 重启的时候,可以通过回放 AOF 日志中的写入指令来重新构建整个数据集。

如果我们想要 Redis 仅仅作为纯内存的缓存来用,那么可以禁止 RDB 和 AOF 所有的持久化机制 。

通过 RDB 或者 AOF 都可以将 Redis 内存中的数据持久化到磁盘上,然后将这些持久化数据备份到云服务上,如果 Redis 挂了,本地内存和磁盘上的数据都丢了,可以从云服务上拉取持久化数据,放到指定的目录,然后重新启动 Redis,Redis 就会根据持久化文件中的数据去恢复内存数据,继续对外提供服务。

如果同时使用 RDB 和 AOF 两种持久化机制,那么在 Redis 重启的时候,会使用 AOF 来重新构建数据,因为 AOF 中的数据更加完整。

image.png

RDB 持久化机制的优点

RDB 周期性的生成持久化数据文件,非常适合做冷备,可以将这种完整的数据文件发送到一些远程的云服务上去,以预定好的备份策略来定期备份 Redis 中的数据。

RDB 对 Redis 对外提供的读写服务影响非常小,可以让 Redis 保持高性能,因为 Redis 主进程只需要周期性的 fork 一个子进程,让子进程执行磁盘IO操作来进行 RDB 持久化,不会每次都影响 Redis 的读写服务。

相对于 AOF 持久化机制来说,直接基于 RDB 数据文件来重启和恢复 Redis 进程,更加快速,因为 RDB 存放的就是一份数据文件,而 AOF 存放的是指令日志,做数据恢复的时候,需要回放和执行所有的指令日志,来恢复内存数据。

RDB 持久化机制的缺点

如果想要在 Redis 故障时,尽可能少的丢失数据,那么 RDB 没有 AOF 好。一般来说,RDB 数据快照文件,都是每隔5分钟,或者更长时间生成一次,这个时候就得接受一旦 Redis 进程宕机,那么会丢失最近5分钟的数据。

RDB 每次在 fork 子进程来执行 RDB 快照数据文件生成的时候,如果数据文件特别大,可能会导致对客户端提供的服务暂停数毫秒,或者甚至数秒。

AOF持久化机制的优点

AOF 可以更好的保护数据不丢失,一般 AOF 会每隔1秒,通过一个后台线程执行一次 fsync 操作,最多丢失1秒钟的数据

AOF 日志文件以 append-only 模式写入,所以没有任何磁盘寻址的开销,写入性能非常高,而且文件不容易破损,即使文件尾部破损,也很容易修复。

AOF 重写的时候,Redis 会开启一个子线程执行,根据当前的内存数据创建日志文件。在创建新日志文件的时候,老的日志文件还是照常写入。当新的日志文件创建完成,再交换新老日志文件即可。

AOF 日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall 命令清空了所有数据,只要这个时候后台 rewrite 还没有发生,那么就可以立即拷贝 AOF 文件,将最后一条 flushall 命令给删了,然后再将该 AOF 文件放回去,就可以自动恢复所有数据。

AOF持久化机制的缺点

对于同一份数据来说,AOF 日志文件通常比 RDB 数据快照文件更大。

AOF 开启后,支持的写 QPS 会比 RDB 支持的写 QPS 低,因为 AOF 一般会配置成每秒 fsync 一次日志文件,当然,每秒一次 fsync,性能也还是很高的。

RDB和AOF到底该如何选择

不要仅仅使用 RDB,因为那样会导致你丢失很多数据。

也不要仅仅使用 AOF,因为那样有两个问题,第一,你通过 AOF 做冷备,没有 RDB 做冷备来的恢复速度更快; 第二,RDB每次简单粗暴生成数据快照,更加健壮,可以避免 AOF 这种复杂的备份和恢复机制的 bug。

综合使用 AOF 和 RDB 两种持久化机制,用 AOF 来保证数据不丢失,作为数据恢复的第一选择;用 RDB 来做冷备,在 AOF 文件都丢失或损坏不可用的时候,还可以使用 RDB 来进行快速的数据恢复。

作者:殷建卫 链接:https://www.yuque.com/yinjianwei/vyrvkf/uvl7g7 来源:殷建卫 - 架构笔记 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。