数据库与缓存 - Redis - 《技术进阶》

基本数据类型
持久化
集群方案
常见问题
应用场景
- 缓存
- 消息队列

基本数据类型

String

在C语言的基础上，封装了简单动态字符串（Simple Dynamic String），增加了capacity和len两个字段分别记录容量和当前长度。
空间预分配：当字符串需扩容时，针对小于1M的，每次加倍，对于超过1M的每次增加1M
空间懒回收：当空间不再使用，不是立马进行回收

List

个数少时用压缩列表ziplist，一段连续的空间（当元素数据大小变更时可能存在级联更新）
个数多时用链表linkedlist
高版本的做了优化，结合了链表和压缩列表，使用quicklist，其实际是每个链表节点下面是ziplist

Hash

个数少时用压缩列表
个体多时用hashtable(数组链表法，实际内部保存了两个hashtable，主要用于扩容)
扩容策略：保存h0、h1，渐进hash的方法进行扩容和缩容

Set

如果全是整数且元素个数小于512个，用整数集合inset
如果不是则使用hashtable，value都是空值

ZSet

使用跳跃表

存储类型

存储类型主要由raw、int、ziplist、linkedlist、quicklist、hashtable、intset，针对上述几种数据类型，在数据长度或元素个数不同时，为了节省空间，底层会选择不同的存储结构进行存储（本质目的都是节约内存）

持久化

过期&淘汰策略

1.如何清理过期数据

定时清理：cpu不友好型，如果某一时间大量数据过期，会占据cpu，而Redis是单线程的，影响正常的业务请求
惰性清理：在每次用户访问时判断是否过期，并进行清理，cpu友好，内存不友好，如果key长期不访问就会长期存在
定期清理：定期的去清理，每次按照一定策略取出20个key进行清理，如果取出的20key中待清理的数量达到85%，还会再清理一次
Redis使用的是惰性清理+定期清理

2.Redis的key的淘汰策略

当redis的内存空间已经用满时，需要依据淘汰策略，进行相应的key的淘汰
（1）no-eviction：不删除策略。当需要更多内存，直接返回错误
（2）allkeys-lru：对所有的key按照lru淘汰
（3）allkeys-random
（4）volatile-lru：设置了过期时间的key，按lru淘汰
（5）volatile-random
（6）volatile-ttl：按照过期剩余时间淘汰

RDB

RDB文件：记录的是内存的数据。
命令：save和bgsave。一般使用bgsave，使用fork子进程，利用cow(copy on write)技术，子进程执行结束后告知父进程
bgsave的执行策略：时间n内发生m次变更，可以配置多条规则

AOF

AOF文件：记录的是对变更数据的命令。
aof缓冲区（命令追加） -> aof文件缓冲区（文件写入） -> 磁盘（文件同步）
fsync参数：
always：每次同步磁盘
everysec：没秒同步磁盘
no：不同步，由操作系统来决定
解决AOF文件过大，AOF文件重写（bgrewriteaof）：重写的过程中合并操作，并将重写过程中执行的命令保存到重写缓冲区，等重写完成再追加到新的AOF文件
AOF和RDB有点类似数据库记录binlog的方式：记录行变化，记录sql，组合方式

集群方案

主从

复制策略
sync：从服务器发起同步，主服务器开始生成RDB文件，等从服务器进行RDB回放完之后，同时将同步期间的命令也发给从服务器，用到复制缓冲区（用于记录RDB文件之后执行的命令，每个从节点对应一个）
psync：三个关键点：服务id，偏移量，缓冲区。如果断开时间中缓存区满了，会丢失数据，用到复制积压缓冲区（在增量复制时，会把中间执行的放在积压缓冲区，如果从节点差距过大，则会全量复制，全局只有一个）
psync 2.0
缺点：无自动故障恢复的能力

哨兵

用一个Sentinel集群来监管Redis集群中的状态，并负责集群的故障转移和恢复（包括选主）的实现

集群

分片策略：客户端分片、代理层分片、服务器分片，Redis Cluster使用的服务器分片，每个服务器还记录了整个集群的分片情况
16384个槽，分布在各个主服务器，每个主服务器有各自的从服务器，服务器之间通过Gossip协议来同步信息。我司的主从服务器分布于不同的机房

常见问题

大Key问题

（1）大key扫描

公司是使用Scan来处理的, scan相对于keys指令，具有分批查询的功能，可以每处理一批，停顿一段时间，避免影响到线上其他的服务
参考：http://jinguoxing.github.io/redis/2018/09/04/redis-scan/

（2）在写入或读取的时候判断是否为大Key

缓存穿透、缓存击穿、缓存雪崩

（1）缓存穿透

访问不存在的key，导致流量打到数据库
解决方案：（1）将不存在的key进行缓存（2）使用布隆过滤器

（2）缓存击穿

某一个热点key过期，导致大量请求直接打到数据库
解决方案：通过加锁的方式，让一个请求去读数据库并更新缓存，其他请求等待

（3）缓存雪崩

当大量的key的在同一个时间过期，就会导致大量的请求全走到数据库，导致缓存雪崩
解决方案：为不同的key设置不同的过期时间（比如加上一个随机值）

缓存与数据库一致更新

更新数据库和缓存时，多个请求的操作顺序引发的不一致问题，一个解决方案是每次写数据库，但是删除缓存（这里不要用更新缓存，会存在不一致的情况）

热key问题

（1）如何发现热key
统计请求，按照4.0的LFU统计
（2）热key如何处理
缓存（读热key），迁移到单独的分片（写热key）

分布式锁

（1）原子命令
setnxexpire，需要考虑超时续期问题
（2）几种实现
RedLock：思想是同时向多个主节点写，如果超过一半的主节点写成功则获得锁
Redisson：思想是基于setnxexpire，在获得锁之后，隔一段时间对锁进行续期（基于watchdog）（获得锁的任务未执行完）, Redisson也对RedLock提供了实现
Redisson分布式锁是基于lua脚本的
公司的分布式锁：提供了基于zk、redis和cellar的三种实现

应用场景

缓存

这种使用场景最常见

消息队列

使用双端队列的性质，可以左边入队，右边出队或者右边入队，左边出队，出队时可以使用blpop和brpop来避免出空队的问题