Remote Dictionary Server,远程字典服务!Key-Value数据库

五大数据类型

String

List

Set

Hash

ZSet

三大特殊类型

Geospatial

Hyperloglog

Bitmap

事务操作

Redis 事务的本质:一组命令的集合!一个事务中的所有命令都会被序列化,在事务执行过程中,会按照顺序执行!
Redis 事务没有隔离级别的概念!
所有的命令在事务中,并没有直接被执行!只有发起执行命令的时候才会执行!
Redis 单条命令是保证原子性的,但是事务是不保证原子性的!

Redis 事务

  • 开启事务(multi)
  • 命令入队(…)
  • 执行事务(exec)

    悲观锁

  • 很悲观,认为什么时候都会出问题,无论什么时候都会加锁!

    乐观锁

  • 很乐观,认为什么时候都不会出问题,所以不会上锁!更新数据的时候去判断一下,在此期间时候有人修改过这个数据。

  • 获取 version
  • 更新的时候比较 version

    Jedis 事务

    1. /**
    2. * 测试Jedis使用Redis的事务,并且当发生异常的时候,时候会出发事务,
    3. * 将执行的操作放弃。
    4. *
    5. * 输出:
    6. * java.lang.ArithmeticException: / by zero
    7. * at com.ebao.jedis.TransactionTest.main(TransactionTest.java:20)
    8. * null
    9. * null
    10. */
    11. public class TransactionTest {
    12. public static void main(String[] args) {
    13. Jedis jedis = new Jedis("127.0.0.1", 6379);
    14. jedis.flushDB();
    15. JSONObject jsonObject = new JSONObject();
    16. jsonObject.put("name", "life");
    17. jsonObject.put("password", "eBao123");
    18. String s = jsonObject.toJSONString();
    19. jedis.watch(s);
    20. Transaction multi = jedis.multi();
    21. try {
    22. multi.set("key1", s);
    23. int i = 1/ 0;
    24. multi.set("key2", s);
    25. multi.exec();
    26. } catch (Exception e) {
    27. multi.discard();
    28. e.printStackTrace();
    29. } finally {
    30. System.out.println(jedis.get("key1"));
    31. System.out.println(jedis.get("key2"));
    32. }
    33. }
    34. }

    SpringBoot 整合

    SpringBoot 操作数据:sprigboot-data jpa jdbc mongoDB redis!
    说明:在 SpringBoot2.x 之后,原来使用的 jedis 被替换为了 lettuce
    jedis:采用的直连,多个线程操作的话,是不安全的,如果想要避免不安全,使用 jedis pool 连接池!更像 BIO 模式。
    lettuce:采用 netty,实例可以再多个线程中进行共享,不存在线程不安全的情况!可以减少线程数据了,更像 NIO 模式。

    1. BIO(同步阻塞):客户端在请求数据的过程中,保持一个连接,不能做其他事情。
    2. NIO(同步非阻塞):客户端在请求数据的过程中,不用保持一个连接,不能做其他事情。(不用保持一个连接,而是用许多个小连接,也就是轮询)
    3. AIO(异步非阻塞):客户端在请求数据的过程中,不用保持一个连接,可以做其他事情。(客户端做其他事情,数据来了等服务端来通知。)

    Redis.conf 详解

    单位

    image.png
    配置文件 unit 单位对大小写不敏感

    包含

    image.png

    网络

  • 绑定的 ip

image.png

  • 保护模式

image.png

  • 端口

image.png

通用配置

  1. daemonize yes # 以守护进程的方式运行,默认是 no,我们需要自己开启为 yes!
  2. pidfile /var/run/redis_6379.pid # 如果以后台的方式运行,我们就需要指定一个 pid 文件!
  3. # Specify the server verbosity level.
  4. # This can be one of:
  5. # debug (a lot of information, useful for development/testing)
  6. # verbose (many rarely useful info, but not a mess like the debug level)
  7. # notice (moderately verbose, what you want in production probably)
  8. # warning (only very important / critical messages are logged)
  9. loglevel notice # 日志
  10. logfile "" # 日志的文件位置名
  11. databases 16 # 数据库我的数量,默认是 16 个
  12. always-show-logo yes # 是否总是显示 LOGO

快照

持久化,在规定的时间内,执行了多少次操作,则会持久化到文件 .rdb .rof
redis 是内存数据库,如果没有持久化,那么数据断电及失!

  1. # 如果 900s 内,如果至少有 1 key 进行了修改,我们即进行持久化操作
  2. save 900 1
  3. # 如果 300s 内,如果至少有 10 key 进行了修改,我们即进行持久化操作
  4. save 300 10
  5. # 如果 60s 内,如果至少有 10000 key 进行了修改,我们即进行持久化操作
  6. save 60 10000
  7. stop-writes-on-bgsave-error yes # 持久化如果出错,是否还需要继续工作!
  8. rdbcompression yes # 是否压缩 rdb 文件,需要消耗一些 CPU 资源!
  9. rdbchecksum yes # 保存rdb 文件的时候,进行错误的检查校验!
  10. dir ./ # rdb 文件保存的目录!

REPLICATION

主从赋值

SECURITY

可以在这里设置 redis 的密码,默认是没有密码!

  1. 127.0.0.1:6379> ping
  2. PONG
  3. 127.0.0.1:6379> config get requirepass # 获取 redis 的密码
  4. 1) "requirepass"
  5. 2) ""
  6. 127.0.0.1:6379> config set requirepass "123456" # 设置 redis 的密码
  7. OK
  8. 127.0.0.1:6379> config get requirepass # 发现命令没有权限
  9. (error) NOAUTH Authentication required.
  10. 127.0.0.1:6379> ping
  11. (error) NOAUTH Authentication required.
  12. 127.0.0.1:6379> auth 123456 # 使用密码进行登录!
  13. OK
  14. 127.0.0.1:6379> config get requirepass
  15. 1) "requirepass"
  16. 2) "123456"

LIMITS

  1. maxclients 10000 # 设置能连接上 redis 的最大客户端的数量
  2. maxmemory <bytes> # 设置 redis 最大的内存容量
  3. maxmemory-policy noeviction # 内存达到上限之后的处理策略
  4. 1. volatile-lru: 只对设置了过期时间的 key 进行 LRU
  5. 2. allkeys-lru: 删除 lru 算法的 key
  6. 3. volatile-random 随即删除即将过期 key
  7. 4. allkeys-random 随机删除
  8. 5. volatile-ttl: 删除即将过期的
  9. 6. noeviction: 永不过期,返回错误

APPEND ONLY MODE

  1. appendonly no # 默认是不开启 aof 模式,默认是使用 rdb 方法持久化,在大部分的情况下,rdb 完全够用
  2. appendfilename "appendonly.aof" # 持久化的文件名字
  3. # appendfsync always
  4. appendfsync everysec # 每秒执行一次 sync,可能会丢失
  5. # appendfsync no

Redis 持久化

RDB(Redis Database)

在主从复制中,rdb 是备用的,放在从机!
Redis - 图6
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是 Snapshot 快照,它恢复时是将快照文件直接读到内存里。
Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程结束,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不会进行任何 IO 操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据回复的完整性不是非常敏感,那 RDB 方式要比 AOP 方式更加的高效。RDB 的缺点就是最后一次持久化后的数据可能丢失。

触发条件

  1. save 的规则满足的情况下,会自动触发 rdb 规则
  2. 执行了 flushall 命令,也会触发 rdb 规则!
  3. 退出 redis,也会产生 rdb 文件!

备份就会自动生成一个 dump.rdb

优点

  1. 适合大规模的数据恢复!dump.rdb
  2. 对数据的完整性要求不高!

    缺点

  3. 需要一定的时间间隔进程操作!如果 redis 意外宕机了,这个最后一次修改的数据就没有了!

  4. fork 进程的时候,会占用一定的内存空间!

    AOF(Append Only File)

    将所有的命令都记录下来,history,恢复的时候将这个文件全部在执行一遍!
    Redis - 图7

以日志的形式来记录每个除了读以外的操作,将 redis 执行过程中的所有指令(读的指令除外)记录下来,只允许追加文件,不可改写文件,redis 启动之初会读取该文件重新构建数据。换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次,以完成数据的恢复工作。

aof 保存的文件是 appendonly.aof,AOF 默认就是文件的无限追加,文件就会越来越大。

如果 aof 文件有错误,这时候 redis 是启动不起来的,我们需要修复这个 aof 文件。
reids 提供了一个工具:redis-check-aof

重写规则

image.png
如果 aof 文件大于 64mb,fork 一个新的进程来将我们的文件重写!

优点

  1. 每一次修改都会同步,文件的完整性会更好!
  2. 每秒同步一次,可能会丢失一秒的数据
  3. 从不同步,效率是最高的!

    缺点

  4. 想对于数据文件来说,aof 远远大于 rdb,修复的速度也比 rdb 慢!

  5. aof 运行效率也要比 rdb 慢,所以我们 redis 默认的持久化是 rdb!

    扩展

  6. RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储

  7. AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大。
  8. 只做缓存,如果只希望数据在服务器运行的时候存在,也可以不使用任何持久化
  9. 同时开启两种持久化方式
    • 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比 RDB 文件保存的数据集要完整。
    • RDB 的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。
  10. 性能建议
    • 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则。
    • 如果Enable AOF ,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite 的最后将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
    • 如果不Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时宕机,会丢失十几分钟的数据,启动脚本也要比较两个 Master/Slave 中的RDB文件,载入较新的那个,微博就是这种架构。

      Redis 发布订阅

      Redis 发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。

Redis - 图9
Redis - 图10Redis - 图11

命令

Redis - 图12

  1. 127.0.0.1:6379> subscribe LOL # 订阅一个频道
  2. Reading messages... (press Ctrl-C to quit)
  3. 1) "subscribe"
  4. 2) "LOL"
  5. 3) (integer) 1
  6. 1) "message"
  7. 2) "LOL"
  8. 3) "lol is good"
  9. 127.0.0.1:6379> publish LOL "lol is good"
  10. (integer) 1

原理

Redis 通过 PUBLISH 、SUBSCRIBE 和 PSUBSCRIBE 等命令实现发布和订阅功能。
通过 SUBSCRIBE 命令订阅某频道后,redis-server 里维护了一个字典,字典的键就是一个个 频道!,
而字典的值则是一个链表,链表中保存了所有订阅这个 channel 的客户端。SUBSCRIBE 命令的关键,
就是将客户端添加到给定 channel 的订阅链表中。
通过 PUBLISH 命令向订阅者发送消息,redis-server 会使用给定的频道作为键,在它所维护的 channel
字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub 从字面上理解就是发布(Publish)与订阅(Subscribe),在Redis中,你可以设定对某一个
key值进行消息发布及消息订阅,当一个key值上进行了消息发布后,所有订阅它的客户端都会收到相应
的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。

主从复制

概念

主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点
(master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。
Master以写为主,Slave 以读为主。
默认情况下,每台Redis服务器都是主节点;
且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
主从复制的作用主要包括:
1、数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
2、故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
3、负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务
(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写
少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
4、高可用(集群)基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下:
1、从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;
2、从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。
电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是”多读少写”。
对于这种场景,我们可以使如下这种架构:
Redis - 图13

环境配置

只配置从机,不配置主机

  1. 127.0.0.1:6379> info replication
  2. # Replication
  3. role:master # 角色 master
  4. connected_slaves:0 # 没有从机
  5. master_replid:44ad43c777f39afbfcb0f27bf89bcb9b141169f9
  6. master_replid2:0000000000000000000000000000000000000000
  7. master_repl_offset:0
  8. second_repl_offset:-1
  9. repl_backlog_active:0
  10. repl_backlog_size:1048576
  11. repl_backlog_first_byte_offset:0
  12. repl_backlog_histlen:0

一主二从

哨兵模式(自动选择主机的模式)

概述

主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵) 架构来解决这个问题。
谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
Redis - 图14
这里的哨兵有两个作用
1.通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
2.当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。
Redis - 图15
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线

优点

  1. 哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
  2. 主从可以切换,故障可以转移,系统的可用性就会更好
  3. 哨兵模式就是主从模式的升级,手动到自动,更加健壮!

    缺点

  4. Redis 不好啊在线扩容的,集群容量一旦到达上限,在线扩容就十分麻烦!

  5. 实现哨兵模式的配置其实是很麻烦的,里面有很多选择!

    Redis 的缓存穿透和雪崩

    服务的高可用

    Redis缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一些问题。其中,最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
    另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。目前,业界也都有比较流行的解决方案。
    Redis - 图16

    缓存穿透(查不到)

    概念

    缓存穿透的概念很简单,用户想要查询一个数据,发现redis内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中(秒杀!),于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。

    解决方案

    布隆过滤器

    布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;
    Redis - 图17

    缓存空对象

    当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源;
    Redis - 图18
    但是这种方法会存在两个问题:
    1、如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多
    的空值的键;
    2、即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于
    需要保持一致性的业务会有影响。

    缓存穿透

    概述

    这里需要注意和缓存击穿的区别,缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。

    解决方案

    设置热点数据永不过期

    从缓存层面来看,没有设置过期时间,所以不会出现热点 key 过期后产生的问题。
    Redis - 图19

    加互斥锁

    分布式锁:使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。

    缓存雪崩

    概念

    缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis 宕机!
    产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。

    解决方案

    redis高可用

    这个思想的含义是,既然redis有可能挂掉,那我多增设几台redis,这样一台挂掉之后其他的还可以继续工作,其实就是搭建的集群。(异地多活!)

    限流降级

    这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。

    数据预热

    数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。