Redis所有的key(键)都是字符串。我们在谈基础数据结构时,讨论的是存储值的数据类型,主要包括常见的5种数据类型,分别是:String、List、Set、Zset、Hash

String字符串

String是redis中最基本的数据类型,一个key对应一个value。
String类型是二进制安全的,意思是 redis 的 string 可以包含任何数据。如数字,字符串,jpg图片或者序列化的对象。Redis中string值,最多512MB

常用命令

命令 简述 使用
set 设置指定键的值 set
get 获取指定键的值 get
del 删除指定键的值 del
incr 将指定的键的值+1,这种类似操作是原子性的 incr
decr 将指定的键的值-1 decr
incrby 将指定的键的值加上一个整数 incrby
decrby 将指定的键的值加上一个整数 incrby
apend 在指定的键后面追加一段字符串 apend
strlen 得到指定键的值得长度 strlen
setnx 只有key不存在时才能设置值 setnx
mset 同时设置一个或者多个key-value对 mset ……
mget 同时获取一个或者多个值 mget ……
msetnx 同时设置多个key-value对,当多有的key都不存在时才能设置。原子性,有一个失败,其他的都失败 msetnx ……
getrange 获取指定键的值的指定范围的子字符串,类似substring,包含前后 getrange
setrange 设置指定键的值,但是从开始索引之后覆盖,开始索引之前不不影响 setrange
setex 设置值得同时,设置过期时间,单位秒 setex
getset 以新值,换旧值,设置新值得同时,返回旧值 getset

数据结构

String 的数据结构为简单动态字符串 (Simple Dynamic String, 缩写 SDS),是可以修改的字符串,内部结构实现上类似于 Java 的 ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配。
image.png
如图中所示,内部为当前字符串实际分配的空间 capacity 一般要高于实际字符串长度 len。当字符串长度小于 1M 时,扩容都是加倍现有的空间,如果超过 1M,扩容时一次只会多扩 1M 的空间。需要注意的是字符串最大长度为 512M。

List列表

单键多值:
Redis列表是简单的字符串表,按照插入的顺序排序,你可以添加一个元素到列表的头部(左边)或者尾部(右边)。
它的底层实际是一个双向链表,对双端的操作性能很高,通过索引下标的操作中间节点性能会较差。

常用命令

命令 简述 使用
lpush/rpush 从左边/右边插入一个或多个值 lpush/rpush ……
lpop/rpop 从左边/右边吐出来一个值,值在键在,值亡键亡 lpop/rpop
lrange 按照索引下标获得元素(从左至右),0左边第一个,-1右边第一个, 0 -1全部 lrange
rpoplpush key1列表右边吐出一个值,插到key2列表左边 rpoplpush
lindex 按照索引下标获得元素(从左到右) lindex
llen 获取列表的长度 llen
linsert…before/after… 在value前面/后面插入newvalue插入值 linsert before/after
lrem 从左边删除n个value(从左到右) lrem
lset 将列表key下标为index的值替换为value lset

数据结构

List 的数据结构为快速链表 quickList。
首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是 ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。
当数据量比较多的时候才会改成 quicklist。因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是 int 类型的数据,结构上还需要两个额外的指针 prev 和 next。

image.png
Redis 将链表和 ziplist 结合起来组成了 quicklist。也就是将多个 ziplist 使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。

Set集合

Redis set 对外提供的功能与 list 类似,是一个列表的功能,特殊之处在于 set 是可以自动排重的,当你需要存储一个列表数据,又不希望出现重复数据时,set 是一个很好的选择,
并且 set 提供了判断某个成员是否在一个 set 集合内的重要接口,这个也是 list 所不能提供的。
Redis 的 Set 是 string 类型的无序集合。它底层其实是一个 value 为 null 的 hash 表,所以添加,删除,查找的复杂度都是 O (1)

常用命令

命令 简述 使用
sadd 将一个或多个member元素加入都集合key中,已经存在的member元素将被忽略 sadd ……
smembers 取出该集合的所有值 smembers
sismember 判断集合key是否含有该value值,有1,没有0 sismember
scard 返回该集合的元素个数 scard
srem 删除集合中的某个元素 srem ……
spop 随机从该集合中吐出一个值,值亡键亡 spop
srandmember 随机从该集合中取出n个值。不会从集合中删除 srandmember
smove 把集合中的一个值移动到另一个集合中 smove
sinter 返回两个集合的交集元素 sinter
sunion 返回两个集合的并集元素 sunion
sdiff 返回两个集合的差集元素(key1中的,不包含key2中的) sdiff

数据结构

Set 数据结构是 dict 字典,字典是用哈希表实现的。
Java 中 HashSet 的内部实现使用的是 HashMap,只不过所有的 value 都指向同一个对象。Redis 的 set 结构也是一样,它的内部也使用 hash 结构,所有的 value 都指向同一个内部值

Hash散列

Redis hash 是一个键值对集合。
Redis hash 是一个 string 类型的 field 和 value 的映射表,hash 特别适合用于存储对象。
类似 Java 里面的 Map
例如:

用户 ID 为查找的 key,存储的 value 用户对象包含姓名,年龄,生日等信息,如果用普通的 key/value 结构来存储,主要有以下 2 种存储方式:

image.png
image.png
方法一:每次修改用户的某个属性需要,先反序列化改好后再序列化回去。开销较大。
方法二:用户 ID 数据冗余。
image.png
通过 key (用户 ID) + field (属性标签) 就可以操作对应属性数据了,既不需要重复存储数据,也不会带来序列化和并发修改控制的问题。

常用命令

命令 简述 使用
hset 给key集合中的field键赋值value hset
hget 从key集合field取出value hget
hmset 批量设置hash的值 hmset ……
hexists 查看哈希表key中,给定field是否存在 hexists
hkeys 列出hash集合的所有field hkeys
hvals 列出该hash集合的所有value hvals
hincrby 为哈西表field的值加上增量 hincrby
hsetnx 将哈希表key中的field的值设置为value,只有field不存在时才能设置 hsetnx

数据结构

Hash 类型对应的数据结构是两种:ziplist(压缩列表),hashtable(哈希表)。当 field-value 长度较短且个数较少时,使用 ziplist,否则使用 hashtable。

Zset有序集合

Redis 有序集合 zset 与普通集合 set 非常相似,是一个没有重复元素的字符串集合。
不同之处是有序集合的每个成员都关联了一个评分(score),这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复了 。
因为元素是有序的,所以你也可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。
访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表

常用命令

命令 简述 使用
zadd 将一个或者多个member元素及其score值加入到有序集合key中 zadd …..
zrange 返回有序集合key中,下标在startindex到endindex之间的元素,带withscores,可以让分数一起和值返回 zrange [withscores]
zrangebyscore 返回有序集合key中所有score值介于min和max之间(包括min和max)的成员。有序集合成员按照score值递增排列 zrangebyscore [withscores] [limit offset count]
zrevrangebyscore 同上,改为从大到小排列,递减 zrevrangebyscore [withscores] [limit offset count]
zincrby 为元素的score加上增量 zincrby/zdecrby
zrem 删除该集合下,指定的元素 zrem
zcount 统计该集合,分数区间内的元素个数 zcount
zrank 返回该值在集合中的排名,从0开始 zrank

数据结构

SortedSet (zset) 是 Redis 提供的一个非常特别的数据结构,一方面它等价于 Java 的数据结构 Map,可以给每一个元素 value 赋予一个权重 score,另一方面它又类似于 TreeSet,内部的元素会按照权重 score 进行排序,可以得到每个元素的名次,还可以通过 score 的范围来获取元素的列表。
zset 底层使用了两个数据结构:

  • hash:hash 的作用就是关联元素 value 和权重 score,保障元素 value 的唯一性,可以通过元素 value 找到相应的 score 值。
  • 跳跃表:跳跃表的目的在于给元素 value 排序,根据 score 的范围获取元素列表。

跳跃表

有序集合在生活中比较常见,例如根据成绩对学生排名,根据得分对玩家排名等。对于有序集合的底层实现,可以用数组、平衡树、链表等。数组不便元素的插入、删除;平衡树或红黑树虽然效率高但结构复杂;链表查询需要遍历所有效率低。Redis 采用的是跳跃表,跳跃表效率堪比红黑树,实现远比红黑树简单。

对比有序链表和跳跃表,从链表中查询出 51:

  • 有序链表

image.png
要查找值为 51 的元素,需要从第一个元素开始依次查找、比较才能找到。共需要 6 次比较。

  • 跳跃表

image.png
从第 2 层开始,1 节点比 51 节点小,向后比较;
21 节点比 51 节点小,继续向后比较,后面就是 NULL 了,所以从 21 节点向下到第 1 层;
在第 1 层,41 节点比 51 节点小,继续向后,61 节点比 51 节点大,所以从 41 向下;
在第 0 层,51 节点为要查找的节点,节点被找到,共查找 4 次。

从此可以看出跳跃表比有序链表效率要高。