1、AOF(Append Only File)

日志的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis 启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作

2、AOF持久化流程

(1)客户端的请求写命令会被 append 追加到 AOF 缓冲区内;
(2)AOF 缓冲区根据AOF持久化策略[always,everysec,no]将操作sync同步到磁盘的AOF文件中;
(3)AOF 文件大小超过重写策略或手动重写时,会对 AOF 文件 rewrite 重写,压缩 AOF 文件容量;
(4)Redis 服务重启时,会重新 load 加载 AOF 文件中的写操作达到数据恢复的目的;
image.png

3、AOF默认不开启

可以在 redis.conf 中配置文件名称,默认为 appendonly.aof

  1. # By default Redis asynchronously dumps the dataset on disk. This mode is
  2. # good enough in many applications, but an issue with the Redis process or
  3. # a power outage may result into a few minutes of writes lost (depending on
  4. # the configured save points).
  5. #
  6. # The Append Only File is an alternative persistence mode that provides
  7. # much better durability. For instance using the default data fsync policy
  8. # (see later in the config file) Redis can lose just one second of writes in a
  9. # dramatic event like a server power outage, or a single write if something
  10. # wrong with the Redis process itself happens, but the operating system is
  11. # still running correctly.
  12. #
  13. # AOF and RDB persistence can be enabled at the same time without problems.
  14. # If the AOF is enabled on startup Redis will load the AOF, that is the file
  15. # with the better durability guarantees.
  16. #
  17. # Please check http://redis.io/topics/persistence for more information.
  18. appendonly no

AOF文件的保存路径,同RDB的路径一致。

4、AOF和RDB同时开启

AOF和RDB同时开启,系统默认取AOF的数据(数据不会存在丢失)

5、AOF启动/修复/恢复

  • AOF的备份机制和性能虽然和RDB不同, 但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要恢复时再拷贝到Redis工作目录下,启动系统即加载。
  • 正常恢复
    • 修改默认的appendonly no,改为yes
    • 将有数据的aof文件复制一份保存到对应目录(查看目录:config get dir)
    • 恢复:重启redis然后重新加载
  • 异常恢复
    • 修改默认的appendonly no,改为yes
    • 如遇到AOF文件损坏,通过/usr/local/bin/redis-check-aof—fix appendonly.aof进行恢复
    • 备份被写坏的AOF文件
    • 恢复:重启redis,然后重新加载

      6、AOF同步频率设置

      appendfsync always
      始终同步,每次Redis的写入都会立刻记入日志;性能较差但数据完整性比较好
      appendfsync everysec
      每秒同步,每秒记入日志一次,如果宕机,本秒的数据可能丢失。
      appendfsync no
      redis不主动进行同步,把同步时机交给操作系统

      7、Rewrite压缩

      1、是什么:

      AOF采用文件追加方式,文件会越来越大为避免出现此种情况,新增了重写机制, 当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof

      2、重写原理,如何实现重写

      AOF文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件最后再rename),redis4.0版本后的重写,是指上就是把rdb 的快照,以二级制的形式附在新的aof头部,作为已有的历史数据,替换掉原来的流水账操作。
      no-appendfsync-on-rewrite:
      如果 no-appendfsync-on-rewrite=yes ,不写入aof文件只写入缓存,用户请求不会阻塞,但是在这段时间如果宕机会丢失这段时间的缓存数据。(降低数据安全性,提高性能)
      如果 no-appendfsync-on-rewrite=no,还是会把数据往磁盘里刷,但是遇到重写操作,可能会发生阻塞。(数据安全,但是性能降低)
      触发机制,何时重写
      Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发
      重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会进行重写。
      auto-aof-rewrite-percentage:设置重写的基准值,文件达到100%时开始重写(文件是原来重写后文件的2倍时触发)
      auto-aof-rewrite-min-size:设置重写的基准值,最小文件64MB。达到这个值开始重写。
      例如:文件达到70MB开始重写,降到50MB,下次什么时候开始重写?100MB
      系统载入时或者上次重写完毕时,Redis会记录此时AOF大小,设为base_size,
      如果Redis的AOF当前大小>= base_size +base_size*100% (默认)且当前大小>=64mb(默认)的情况下,Redis会对AOF进行重写。

      3、重写流程

      (1)bgrewriteaof触发重写,判断是否当前有bgsave或bgrewriteaof在运行,如果有,则等待该命令结束后再继续执行。
      (2)主进程fork出子进程执行重写操作,保证主进程不会阻塞。
      (3)子进程遍历redis内存中数据到临时文件,客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失。
      (4)
      1).子进程写完新的AOF文件后,向主进程发信号,父进程更新统计信息。
      2).主进程把aof_rewrite_buf中的数据写入到新的AOF文件。
      (5)使用新的AOF文件覆盖旧的AOF文件,完成AOF重写。

8、优劣

image.png
优势:

  • 备份机制更稳健,丢失数据概率更低。
  • 可读的日志文本,通过操作AOF稳健,可以处理误操作。

劣势:

  • 比起RDB占用更多的磁盘空间。
  • 恢复备份速度要慢。
  • 每次读写都同步的话,有一定的性能压力。
  • 存在个别Bug,造成恢复不能。

    9、总结

  • AOF 文件是一个只进行追加的日志文件

  • Redis 可以在 AOF 文件体积变得过大时,自动地在后台对 AOF 进行重写
  • AOF 文件有序地保存了对数据库执行的所有写入操作,这些写入操作以 Redis 协议的格式保存,因此 AOF 文件的内容非常容易被人读懂,对文件进行分析也很轻松
  • 对于相同的数据集来说,AOF 文件的体积通常要大于 RDB 文件的体积
  • 根据所使用的 fsync 策略,AOF 的速度可能会慢于 RDB

    10、选择持久化方式的建议

  • RDB 持久化方式能够在指定的时间间隔能对你的数据进行快照存储

  • AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF 命令以 redis 协议追加保存每次写的操作到文件末尾.
  • Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大
  • 只做缓存:如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式.
  • 同时开启两种持久化方式
  • 在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据, 因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整.
  • RDB 的数据不实时,同时使用两者时服务器重启也只会找 AOF 文件。那要不要只使用 AOF 呢?
  • 建议不要,因为 RDB 更适合用于备份数据库( AOF 在不断变化不好备份),快速重启,而且不会有 AOF 可能潜在的 bug,留着作为一个万一的手段。
  • 性能建议

    因为 RDB 文件只用作后备用途,建议只在 Slave 上持久化 RDB 文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则。 如果使用 AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只 load 自己的 AOF 文件就可以了。 代价,一是带来了持续的 IO,二是 AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。 只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值64M太小了,可以设到5G以上。 默认超过原大小100%大小时重写可以改到适当的数值。