Remote Dictionary Server,远程字典服务!Key-Value数据库
五大数据类型
String
List
Set
Hash
ZSet
三大特殊类型
Geospatial
Hyperloglog
Bitmap
事务操作
Redis 事务的本质:一组命令的集合!一个事务中的所有命令都会被序列化,在事务执行过程中,会按照顺序执行!
Redis 事务没有隔离级别的概念!
所有的命令在事务中,并没有直接被执行!只有发起执行命令的时候才会执行!
Redis 单条命令是保证原子性的,但是事务是不保证原子性的!
Redis 事务
- 开启事务(multi)
- 命令入队(…)
-
悲观锁
-
乐观锁
很乐观,认为什么时候都不会出问题,所以不会上锁!更新数据的时候去判断一下,在此期间时候有人修改过这个数据。
- 获取 version
-
Jedis 事务
/**
* 测试Jedis使用Redis的事务,并且当发生异常的时候,时候会出发事务,
* 将执行的操作放弃。
*
* 输出:
* java.lang.ArithmeticException: / by zero
* at com.ebao.jedis.TransactionTest.main(TransactionTest.java:20)
* null
* null
*/
public class TransactionTest {
public static void main(String[] args) {
Jedis jedis = new Jedis("127.0.0.1", 6379);
jedis.flushDB();
JSONObject jsonObject = new JSONObject();
jsonObject.put("name", "life");
jsonObject.put("password", "eBao123");
String s = jsonObject.toJSONString();
jedis.watch(s);
Transaction multi = jedis.multi();
try {
multi.set("key1", s);
int i = 1/ 0;
multi.set("key2", s);
multi.exec();
} catch (Exception e) {
multi.discard();
e.printStackTrace();
} finally {
System.out.println(jedis.get("key1"));
System.out.println(jedis.get("key2"));
}
}
}
SpringBoot 整合
SpringBoot 操作数据:sprigboot-data jpa jdbc mongoDB redis!
说明:在 SpringBoot2.x 之后,原来使用的 jedis 被替换为了 lettuce
jedis:采用的直连,多个线程操作的话,是不安全的,如果想要避免不安全,使用 jedis pool 连接池!更像 BIO 模式。
lettuce:采用 netty,实例可以再多个线程中进行共享,不存在线程不安全的情况!可以减少线程数据了,更像 NIO 模式。BIO(同步阻塞):客户端在请求数据的过程中,保持一个连接,不能做其他事情。
NIO(同步非阻塞):客户端在请求数据的过程中,不用保持一个连接,不能做其他事情。(不用保持一个连接,而是用许多个小连接,也就是轮询)
AIO(异步非阻塞):客户端在请求数据的过程中,不用保持一个连接,可以做其他事情。(客户端做其他事情,数据来了等服务端来通知。)
Redis.conf 详解
单位
包含
网络
绑定的 ip
- 保护模式
- 端口
通用配置
daemonize yes # 以守护进程的方式运行,默认是 no,我们需要自己开启为 yes!
pidfile /var/run/redis_6379.pid # 如果以后台的方式运行,我们就需要指定一个 pid 文件!
# Specify the server verbosity level.
# This can be one of:
# debug (a lot of information, useful for development/testing)
# verbose (many rarely useful info, but not a mess like the debug level)
# notice (moderately verbose, what you want in production probably)
# warning (only very important / critical messages are logged)
loglevel notice # 日志
logfile "" # 日志的文件位置名
databases 16 # 数据库我的数量,默认是 16 个
always-show-logo yes # 是否总是显示 LOGO
快照
持久化,在规定的时间内,执行了多少次操作,则会持久化到文件 .rdb .rof
redis 是内存数据库,如果没有持久化,那么数据断电及失!
# 如果 900s 内,如果至少有 1 key 进行了修改,我们即进行持久化操作
save 900 1
# 如果 300s 内,如果至少有 10 key 进行了修改,我们即进行持久化操作
save 300 10
# 如果 60s 内,如果至少有 10000 key 进行了修改,我们即进行持久化操作
save 60 10000
stop-writes-on-bgsave-error yes # 持久化如果出错,是否还需要继续工作!
rdbcompression yes # 是否压缩 rdb 文件,需要消耗一些 CPU 资源!
rdbchecksum yes # 保存rdb 文件的时候,进行错误的检查校验!
dir ./ # rdb 文件保存的目录!
REPLICATION
SECURITY
可以在这里设置 redis 的密码,默认是没有密码!
127.0.0.1:6379> ping
PONG
127.0.0.1:6379> config get requirepass # 获取 redis 的密码
1) "requirepass"
2) ""
127.0.0.1:6379> config set requirepass "123456" # 设置 redis 的密码
OK
127.0.0.1:6379> config get requirepass # 发现命令没有权限
(error) NOAUTH Authentication required.
127.0.0.1:6379> ping
(error) NOAUTH Authentication required.
127.0.0.1:6379> auth 123456 # 使用密码进行登录!
OK
127.0.0.1:6379> config get requirepass
1) "requirepass"
2) "123456"
LIMITS
maxclients 10000 # 设置能连接上 redis 的最大客户端的数量
maxmemory <bytes> # 设置 redis 最大的内存容量
maxmemory-policy noeviction # 内存达到上限之后的处理策略
1. volatile-lru: 只对设置了过期时间的 key 进行 LRU
2. allkeys-lru: 删除 lru 算法的 key
3. volatile-random: 随即删除即将过期 key
4. allkeys-random: 随机删除
5. volatile-ttl: 删除即将过期的
6. noeviction: 永不过期,返回错误
APPEND ONLY MODE
appendonly no # 默认是不开启 aof 模式,默认是使用 rdb 方法持久化,在大部分的情况下,rdb 完全够用
appendfilename "appendonly.aof" # 持久化的文件名字
# appendfsync always
appendfsync everysec # 每秒执行一次 sync,可能会丢失
# appendfsync no
Redis 持久化
RDB(Redis Database)
在主从复制中,rdb 是备用的,放在从机!
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是 Snapshot 快照,它恢复时是将快照文件直接读到内存里。
Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程结束,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不会进行任何 IO 操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据回复的完整性不是非常敏感,那 RDB 方式要比 AOP 方式更加的高效。RDB 的缺点就是最后一次持久化后的数据可能丢失。
触发条件
- save 的规则满足的情况下,会自动触发 rdb 规则
- 执行了 flushall 命令,也会触发 rdb 规则!
- 退出 redis,也会产生 rdb 文件!
优点
- 适合大规模的数据恢复!dump.rdb
-
缺点
需要一定的时间间隔进程操作!如果 redis 意外宕机了,这个最后一次修改的数据就没有了!
- fork 进程的时候,会占用一定的内存空间!
AOF(Append Only File)
将所有的命令都记录下来,history,恢复的时候将这个文件全部在执行一遍!
以日志的形式来记录每个除了读以外的操作,将 redis 执行过程中的所有指令(读的指令除外)记录下来,只允许追加文件,不可改写文件,redis 启动之初会读取该文件重新构建数据。换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次,以完成数据的恢复工作。
aof 保存的文件是 appendonly.aof,AOF 默认就是文件的无限追加,文件就会越来越大。
如果 aof 文件有错误,这时候 redis 是启动不起来的,我们需要修复这个 aof 文件。
reids 提供了一个工具:redis-check-aof
重写规则
如果 aof 文件大于 64mb,fork 一个新的进程来将我们的文件重写!
优点
- 每一次修改都会同步,文件的完整性会更好!
- 每秒同步一次,可能会丢失一秒的数据
-
缺点
想对于数据文件来说,aof 远远大于 rdb,修复的速度也比 rdb 慢!
aof 运行效率也要比 rdb 慢,所以我们 redis 默认的持久化是 rdb!
扩展
RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储
- AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大。
- 只做缓存,如果只希望数据在服务器运行的时候存在,也可以不使用任何持久化
- 同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比 RDB 文件保存的数据集要完整。
- RDB 的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。
- 性能建议
- 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留
save 900 1
这条规则。 - 如果Enable AOF ,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
- 如果不Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时宕机,会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的RDB文件,载入较新的那个,微博就是这种架构。
Redis 发布订阅
Redis 发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。
- 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留
命令
127.0.0.1:6379> subscribe LOL # 订阅一个频道
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "LOL"
3) (integer) 1
1) "message"
2) "LOL"
3) "lol is good"
127.0.0.1:6379> publish LOL "lol is good"
(integer) 1
原理
Redis 通过 PUBLISH 、SUBSCRIBE 和 PSUBSCRIBE 等命令实现发布和订阅功能。
通过 SUBSCRIBE
命令订阅某频道后,redis-server 里维护了一个字典,字典的键就是一个个 频道!,
而字典的值则是一个链表,链表中保存了所有订阅这个 channel 的客户端。SUBSCRIBE 命令的关键,
就是将客户端添加到给定 channel 的订阅链表中。
通过 PUBLISH
命令向订阅者发送消息,redis-server 会使用给定的频道作为键,在它所维护的 channel
字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub 从字面上理解就是发布(Publish)与订阅(Subscribe),在Redis中,你可以设定对某一个
key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应
的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。
主从复制
概念
主从复制
,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点
(master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。
Master以写为主,Slave 以读为主。
默认情况下,每台Redis服务器都是主节点;
且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
主从复制的作用主要包括:
1、数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
2、故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
3、负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务
(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写
少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
4、高可用(集群)基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下:
1、从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;
2、从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。
电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是”多读少写”。
对于这种场景,我们可以使如下这种架构:
环境配置
只配置从机,不配置主机
127.0.0.1:6379> info replication
# Replication
role:master # 角色 master
connected_slaves:0 # 没有从机
master_replid:44ad43c777f39afbfcb0f27bf89bcb9b141169f9
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
一主二从
哨兵模式(自动选择主机的模式)
概述
主从切换技术
的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵) 架构来解决这个问题。
谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库
。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
这里的哨兵有两个作用
1.通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
2.当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线
。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线
优点
- 哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
- 主从可以切换,故障可以转移,系统的可用性就会更好
-
缺点
Redis 不好啊在线扩容的,集群容量一旦到达上限,在线扩容就十分麻烦!
- 实现哨兵模式的配置其实是很麻烦的,里面有很多选择!
Redis 的缓存穿透和雪崩
服务的高可用
Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中,最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。目前,业界也都有比较流行的解决方案。
缓存穿透(查不到)
概念
缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中(秒杀!),于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。解决方案
布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;
缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源;
但是这种方法会存在两个问题:
1、如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多
的空值的键;
2、即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于
需要保持一致性的业务会有影响。缓存穿透
概述
这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。解决方案
设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点 key 过期后产生的问题。
加互斥锁
分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。缓存雪崩
概念
缓存雪崩
,是指在某一个时间段,缓存集中过期失效。Redis 宕机!
产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。解决方案
redis高可用
这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。(异地多活!)限流降级
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。数据预热
数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。