Redis 持久化 RDB AOF

Redis持久化

Redis作为一个键值对内存数据库(NoSQL),数据都存储在内存当中,在处理客户端请求时,所有操作都在内存当中进行,如下所示:
image.png
这样做有什么问题呢?
存储在内存当中的数据,只要服务器关机(各种原因引起的),内存中的数据就会消失了,不仅服务器关机会造成数据消失,Redis服务器守护进程退出,内存中的数据也一样会消失。
image.png
对于只把Redis当缓存来用的项目来说,数据消失或许问题不大,重新从数据源把数据加载进来就可以了,但如果直接把用户提交的业务数据存储在Redis当中,把Redis作为数据库来使用,在其放存储重要业务数据,那么Redis的内存数据丢失所造成的影响也许是毁灭性。
为了避免内存中数据丢失,Redis提供了对持久化的支持,可以选择不同的方式将数据从内存中保存到硬盘当中,使数据可以持久化保存。
image.png
Redis提供了RDB和AOF两种不同的数据持久化方式。


RDB

RDB是一种快照存储持久化方式,具体就是将Redis某一时刻的内存数据保存到硬盘的文件当中,默认保存的文件名为dump.rdb,而在Redis服务器启动时,会重新加载dump.rdb文件的数据到内存当中恢复数据。

开启RDB持久化方式

开启RDB持久化方式很简单,客户端可以通过向Redis服务器发送save或bgsave命令让服务器生成rdb文件,或者通过服务器配置文件指定触发RDB条件。

1. save命令

save命令是一个同步操作。

  1. # 同步数据到磁盘上
  2. > save

image.png
当客户端向服务器发送save命令请求进行持久化时,服务器会阻塞save命令之后的其他客户端的请求,直到数据同步完成。
如果数据量太大,同步数据会执行很久,而这期间Redis服务器也无法接收其他请求,所以,最好不要在生产环境使用save命令。

2. bgsave

与save命令不同,bgsave命令是一个异步操作。

  1. # 异步保存数据集到磁盘上
  2. > bgsave

image.png
当客户端发服务发出bgsave命令时,Redis服务器主进程会forks一个子进程来数据同步问题,在将数据保存到rdb文件之后,子进程会退出。
所以,与save命令相比,Redis服务器在处理bgsave采用子线程进行IO写入,而主进程仍然可以接收其他请求,但forks子进程是同步的,所以forks子进程时,一样不能接收其他请求,这意味着,如果forks一个子进程花费的时间太久(一般是很快的),bgsave命令仍然有阻塞其他客户的请求的情况发生。

3. 服务器配置自动触发

除了通过客户端发送命令外,还有一种方式,就是在Redis配置文件中的save指定到达触发RDB持久化的条件,比如【多少秒内至少达到多少写操作】就开启RDB数据同步。
例如可以在配置文件redis.conf指定如下的选项:

  1. # 900s内至少达到一条写命令
  2. save 900 1
  3. # 300s内至少达至10条写命令
  4. save 300 10
  5. # 60s内至少达到10000条写命令
  6. save 60 10000

之后在启动服务器时加载配置文件。

  1. # 启动服务器加载配置文件
  2. redis-server redis.conf

这种通过服务器配置文件触发RDB的方式,与bgsave命令类似,达到触发条件时,会forks一个子进程进行数据同步,不过最好不要通过这方式来触发RDB持久化,因为设置触发的时间太短,则容易频繁写入rdb文件,影响服务器性能,时间设置太长则会造成数据丢失。

rdb文件

前面介绍了三种让服务器生成rdb文件的方式,无论是由主进程生成还是子进程来生成,其过程如下:

  • 生成临时rdb文件,并写入数据。
  • 完成数据写入,用临时文代替代正式rdb文件。
  • 删除原来的db文件。

RDB默认生成的文件名为dump.rdb,当然,可以通过配置文件进行更加详细配置,比如在单机下启动多个redis服务器进程时,可以通过端口号配置不同的rdb名称,如下所示:

  1. # 是否压缩rdb文件
  2. rdbcompression yes
  3. # rdb文件的名称
  4. dbfilename redis-6379.rdb
  5. # rdb文件保存目录
  6. dir ~/redis/

RDB的几个优点

  • 与AOF方式相比,通过rdb文件恢复数据比较快。
  • rdb文件非常紧凑,适合于数据备份。
  • 通过RDB进行数据备,由于使用子进程生成,所以对Redis服务器性能影响较小。

RDB的几个缺点

  • 如果服务器宕机的话,采用RDB的方式会造成某个时段内数据的丢失,比如设置10分钟同步一次或5分钟达到1000次写入就同步一次,那么如果还没达到触发条件服务器就死机了,那么这个时间段的数据会丢失。
  • 使用save命令会造成服务器阻塞,直接数据同步完成才能接收后续请求。
  • 使用bgsave命令在forks子进程时,如果数据量太大,forks的过程也会发生阻塞,另外,forks子进程会耗费内存。

AOF

Redis的另外一个持久化方式:AOF(Append-only file)。
与RDB存储某个时刻的快照不同,AOF持久化方式会记录客户端对服务器的每一次写操作命令,并将这些写操作以Redis协议追加保存到以后缀为aof文件末尾,在Redis服务器重启时,会加载并运行aof文件的命令,以达到恢复数据的目的。
image.png
开启AOF持久化方式
Redis默认不开启AOF持久化方式,可以在配置文件中开启并进行更加详细的配置,如下面的redis.conf文件:

  1. # 开启aof机制
  2. appendonly yes
  3. # aof文件名
  4. appendfilename "appendonly.aof"
  5. # 写入策略,always表示每个写操作都保存到aof文件中,也可以是everysec或no
  6. appendfsync always
  7. # 默认不重写aof文件
  8. no-appendfsync-on-rewrite no
  9. # 保存目录
  10. dir ~/redis/

三种写入策略

在上面的配置文件中,可以通过appendfsync选项指定写入策略,有三个选项

  1. appendfsync always
  2. # appendfsync everysec
  3. # appendfsync no

1. always

客户端的每一个写操作都保存到aof文件当,这种策略很安全,但是每个写请注都有IO操作,所以也很慢。

2. everysec

appendfsync的默认写入策略,每秒写入一次aof文件,因此,最多可能会丢失1s的数据。

3. no

Redis服务器不负责写入aof,而是交由操作系统来处理什么时候写入aof文件。更快,但也是最不安全的选择,不推荐使用。

AOF文件重写

AOF将客户端的每一个写操作都追加到aof文件末尾,比如对一个key多次执行incr命令,这时候,aof保存每一次命令到aof文件中,aof文件会变得非常大。

  1. incr num 1
  2. incr num 2
  3. incr num 3
  4. incr num 4
  5. incr num 5
  6. incr num 6
  7. ...
  8. incr num 100000

aof文件太大,加载aof文件恢复数据时,就会非常慢,为了解决这个问题,Redis支持aof文件重写,通过重写aof,可以生成一个恢复当前数据的最少命令集,比如上面的例子中那么多条命令,可以重写为:

  1. set num 100000

aof文件是一个二进制文件,并不是像上面的例子一样,直接保存每个命令,而使用Redis自己的格式,上面只是方便演示。

两种重写方式

通过在redis.conf配置文件中的选项 no-appendfsync-on-rewrite 可以设置是否开启重写,这种方式会在每次fsync时都重写,影响服务器性以,因此默认值为no,不推荐使用。

  1. # 默认不重写aof文件
  2. no-appendfsync-on-rewrite no

客户端向服务器发送bgrewriteaof命令,也可以让服务器进行AOF重写。

  1. # 让服务器异步重写追加aof文件命令
  2. > bgrewriteaof

AOF重写方式也是异步操作,即如果要写入aof文件,则Redis主进程会forks一个子进程来处理,如下所示:
image.png
重写aof文件的好处

  • 压缩aof文件,减少磁盘占用量。
  • 将aof的命令压缩为最小命令集,加快了数据恢复的速度。

Redis 配置文件中有两个对应的参数是来决定重写机制的触发时机的。

auto-aof-rewrite-percentage:AOF 文件距离上次文件增长超过多少百分比
auto-aof-rewrite-min-size:AOF 文件体积最小多大以上触发

满足所设置的条件时,会自动触发 AOF 重写,此时 Redis 会扫描整个实例的数据,重新生成一个 AOF 文件来达到瘦身的效果。

AOF文件损坏的恢复

在写入aof日志文件时,如果Redis服务器宕机,则aof日志文件文件会出格式错误,在重启Redis服务器时,Redis服务器会拒绝载入这个aof文件,可以通过以下步骤修复aof并恢复数据。
Redis的持久化机制:RDB和AOF - 图8
和 RBD 不同的是,Redis 中是通过创建一个不带网络连接的伪客户端来进行实现的。为什么要创建伪客户端呢?AOF 文件中的数据格式,都是由命令组成的。通过客户端直接执行每条命令就可以将数据进行恢复。
1、备份现在aof文件,以防万一。
2、使用redis-check-aof命令修复aof文件,该命令格式如下:

  1. # 修复aof日志文件
  2. $ redis-check-aof -fix file.aof

3、重启Redis服务器,加载已经修复的aof文件,恢复数据。 :::tips 注意的是,如果服务器开启了 AOF 持久化功能,会优先使用 AOF 文件来进行恢复。只有在 AOF 关闭状态下,服务器才会使用 RDB 文件来进行还原。 ::: Redis的持久化机制:RDB和AOF - 图9

AOF的优点

  • AOF只是追加日志文件,因此对服务器性能影响较小,速度比RDB要快,消耗的内存较少。

    AOF的缺点

  • AOF方式生成的日志文件太大,即使通过AFO重写,文件体积仍然很大。

  • 恢复数据的速度比RDB慢。

RDB和AOF对比选择

1、RDB 优点与缺点

(1)优点

文件体积小:RDB 的文件内容是二进制格式,因此体积比实例内存小。恢复速度快:当 Redis 实例恢复时,加载 RDB 文件速度很快,能在很短时间内迅速恢复数据。

(2)缺点

数据缺失:RDB 保存的是某一时刻的数据,当 Redis 实例某一时刻异常时,会导致数据丢失。消耗资源:RDB 文件的生成会消耗大量的 CPU 和内存资源,有一定代价。

2、AOF 优点与缺点

(1)优点

数据更完整:AOF 中是及时写入的方式,数据保存更完整。恢复时降低数据的损失率易读性强:AOF 中保存的数据格式是客户端的写入命令,可读性性强。

(2)缺点

文件体积大:AOF 中存储客户端所有的写命令,未经压缩,随着命令的写入,文件会越来越大。增加磁盘IO:AOF 文件刷盘如果采用每秒刷一次的方式会导致磁盘IO升高,影响性能。
通过上面的介绍,了解了RDB与AOF各自的优点与缺点,到底要如何选择呢?
通过下面的表,可以从几个方面对比一下RDB与AOF,在应用时,要根本自己的实际需求,选择RDB或者AOF,其实,如果想要数据足够安全,可以两种方式都开启,但两种持久化方式同时进行IO操作,会严重影响服务器性能,因此有时候不得不做出选择。

方式 RDB AOF
启动优化级
体积
恢复速度 由策略决定
数据安全性 会丢数据 由策略决定
轻重

当RDB与AOF两种方式都开启时,Redis会优先使用AOF日志来恢复数据,因为AOF保存的文件比RDB文件更完整。

混合持久化

既然 RDB 与 AOF 持久化都存在各自的缺点,那么有没有一种更好的持久化方式?
那就是混合持久化。其实就是 RDB 与 AOF 的混合模式,这是 Redis4 之后新增的。
1、持久化方式
混合持久化是通过 aof-use-rdb-preamble 参数来开启的。它的操作方式是这样的,在写入的时候先把数据以 RDB 的形式写入文件的开头,再将后续的写命令以 AOF 的格式追加到文件中。这样既能保证数据恢复时的速度,同时又能减少数据丢失的风险。
2、文件恢复
那么混合持久化中是如何来进行数据恢复的呢?在 Redis 重启时,先加载 RDB 的内容,然后再重放增量 AOF 格式命令。这样就避免了 AOF 持久化时的全量加载,从而使加载速率得到大幅提升。

总结

RDB持久化

  • 将某一时刻的数据以二进制形式写入到磁盘里,服务重启时检测到对应文件自动加载进行数据恢复。
  • 有手动触发和自动触发两种机制。

    AOF持久化

  • 以文件追加的方式写入客户端执行的写命令。

  • 数据恢复时,通过创建伪客户端的方式执行命令,直到恢复完成。

    混合持久化

  • 在写入的时候先把数据以 RDB 的形式写入文件的开头,再将后续的写命令以 AOF 的格式追加到文件中。