Redis所有的key(键)都是字符串。我们在谈基础数据结构时,讨论的是存储值的数据类型,主要包括常见的5种数据类型,分别是:String、List、Set、Zset、Hash
String字符串
String是redis中最基本的数据类型,一个key对应一个value。
String类型是二进制安全的,意思是 redis 的 string 可以包含任何数据。如数字,字符串,jpg图片或者序列化的对象。Redis中string值,最多512MB
常用命令
命令 | 简述 | 使用 |
---|---|---|
set | 设置指定键的值 | set |
get | 获取指定键的值 | get |
del | 删除指定键的值 | del |
incr | 将指定的键的值+1,这种类似操作是原子性的 | incr |
decr | 将指定的键的值-1 | decr |
incrby | 将指定的键的值加上一个整数 | incrby |
decrby | 将指定的键的值加上一个整数 | incrby |
apend | 在指定的键后面追加一段字符串 | apend |
strlen | 得到指定键的值得长度 | strlen |
setnx | 只有key不存在时才能设置值 | setnx |
mset | 同时设置一个或者多个key-value对 | mset |
mget | 同时获取一个或者多个值 | mget |
msetnx | 同时设置多个key-value对,当多有的key都不存在时才能设置。原子性,有一个失败,其他的都失败 | msetnx |
getrange | 获取指定键的值的指定范围的子字符串,类似substring,包含前后 | getrange |
setrange | 设置指定键的值,但是从开始索引之后覆盖,开始索引之前不不影响 | setrange |
setex | 设置值得同时,设置过期时间,单位秒 | setex |
getset | 以新值,换旧值,设置新值得同时,返回旧值 | getset |
数据结构
String 的数据结构为简单动态字符串 (Simple Dynamic String, 缩写 SDS),是可以修改的字符串,内部结构实现上类似于 Java 的 ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配。
如图中所示,内部为当前字符串实际分配的空间 capacity 一般要高于实际字符串长度 len。当字符串长度小于 1M 时,扩容都是加倍现有的空间,如果超过 1M,扩容时一次只会多扩 1M 的空间。需要注意的是字符串最大长度为 512M。
List列表
单键多值:
Redis列表是简单的字符串表,按照插入的顺序排序,你可以添加一个元素到列表的头部(左边)或者尾部(右边)。
它的底层实际是一个双向链表,对双端的操作性能很高,通过索引下标的操作中间节点性能会较差。
常用命令
命令 | 简述 | 使用 |
---|---|---|
lpush/rpush | 从左边/右边插入一个或多个值 | lpush/rpush |
lpop/rpop | 从左边/右边吐出来一个值,值在键在,值亡键亡 | lpop/rpop |
lrange | 按照索引下标获得元素(从左至右),0左边第一个,-1右边第一个, 0 -1全部 | lrange |
rpoplpush | key1列表右边吐出一个值,插到key2列表左边 | rpoplpush |
lindex | 按照索引下标获得元素(从左到右) | lindex |
llen | 获取列表的长度 | llen |
linsert…before/after… | 在value前面/后面插入newvalue插入值 | linsert |
lrem | 从左边删除n个value(从左到右) | lrem |
lset | 将列表key下标为index的值替换为value | lset |
数据结构
List 的数据结构为快速链表 quickList。
首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是 ziplist,也即是压缩列表。它将所有的元素紧挨着一起存储,分配的是一块连续的内存。
当数据量比较多的时候才会改成 quicklist。因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是 int 类型的数据,结构上还需要两个额外的指针 prev 和 next。
Redis 将链表和 ziplist 结合起来组成了 quicklist。也就是将多个 ziplist 使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。
Set集合
Redis set 对外提供的功能与 list 类似,是一个列表的功能,特殊之处在于 set 是可以自动排重的,当你需要存储一个列表数据,又不希望出现重复数据时,set 是一个很好的选择,
并且 set 提供了判断某个成员是否在一个 set 集合内的重要接口,这个也是 list 所不能提供的。
Redis 的 Set 是 string 类型的无序集合。它底层其实是一个 value 为 null 的 hash 表,所以添加,删除,查找的复杂度都是 O (1)。
常用命令
命令 | 简述 | 使用 |
---|---|---|
sadd | 将一个或多个member元素加入都集合key中,已经存在的member元素将被忽略 | sadd |
smembers | 取出该集合的所有值 | smembers |
sismember | 判断集合key是否含有该value值,有1,没有0 | sismember |
scard | 返回该集合的元素个数 | scard |
srem | 删除集合中的某个元素 | srem |
spop | 随机从该集合中吐出一个值,值亡键亡 | spop |
srandmember | 随机从该集合中取出n个值。不会从集合中删除 | srandmember |
smove | 把集合中的一个值移动到另一个集合中 | smove |
sinter | 返回两个集合的交集元素 | sinter |
sunion | 返回两个集合的并集元素 | sunion |
sdiff | 返回两个集合的差集元素(key1中的,不包含key2中的) | sdiff |
数据结构
Set 数据结构是 dict 字典,字典是用哈希表实现的。
Java 中 HashSet 的内部实现使用的是 HashMap,只不过所有的 value 都指向同一个对象。Redis 的 set 结构也是一样,它的内部也使用 hash 结构,所有的 value 都指向同一个内部值
Hash散列
Redis hash 是一个键值对集合。
Redis hash 是一个 string 类型的 field 和 value 的映射表,hash 特别适合用于存储对象。
类似 Java 里面的 Map
例如:
用户 ID 为查找的 key,存储的 value 用户对象包含姓名,年龄,生日等信息,如果用普通的 key/value 结构来存储,主要有以下 2 种存储方式:
方法一:每次修改用户的某个属性需要,先反序列化改好后再序列化回去。开销较大。
方法二:用户 ID 数据冗余。
通过 key (用户 ID) + field (属性标签) 就可以操作对应属性数据了,既不需要重复存储数据,也不会带来序列化和并发修改控制的问题。
常用命令
命令 | 简述 | 使用 |
---|---|---|
hset | 给key集合中的field键赋值value | hset |
hget | 从key集合field取出value | hget |
hmset | 批量设置hash的值 | hmset |
hexists | 查看哈希表key中,给定field是否存在 | hexists |
hkeys | 列出hash集合的所有field | hkeys |
hvals | 列出该hash集合的所有value | hvals |
hincrby | 为哈西表field的值加上增量 | hincrby |
hsetnx | 将哈希表key中的field的值设置为value,只有field不存在时才能设置 | hsetnx |
数据结构
Hash 类型对应的数据结构是两种:ziplist(压缩列表),hashtable(哈希表)。当 field-value 长度较短且个数较少时,使用 ziplist,否则使用 hashtable。
Zset有序集合
Redis 有序集合 zset 与普通集合 set 非常相似,是一个没有重复元素的字符串集合。
不同之处是有序集合的每个成员都关联了一个评分(score),这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复了 。
因为元素是有序的,所以你也可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。
访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表
常用命令
命令 | 简述 | 使用 |
---|---|---|
zadd | 将一个或者多个member元素及其score值加入到有序集合key中 | zadd |
zrange | 返回有序集合key中,下标在startindex到endindex之间的元素,带withscores,可以让分数一起和值返回 | zrange |
zrangebyscore | 返回有序集合key中所有score值介于min和max之间(包括min和max)的成员。有序集合成员按照score值递增排列 | zrangebyscore |
zrevrangebyscore | 同上,改为从大到小排列,递减 | zrevrangebyscore |
zincrby | 为元素的score加上增量 | zincrby/zdecrby |
zrem | 删除该集合下,指定的元素 | zrem |
zcount | 统计该集合,分数区间内的元素个数 | zcount |
zrank | 返回该值在集合中的排名,从0开始 | zrank |
数据结构
SortedSet (zset) 是 Redis 提供的一个非常特别的数据结构,一方面它等价于 Java 的数据结构 Map
zset 底层使用了两个数据结构:
- hash:hash 的作用就是关联元素 value 和权重 score,保障元素 value 的唯一性,可以通过元素 value 找到相应的 score 值。
- 跳跃表:跳跃表的目的在于给元素 value 排序,根据 score 的范围获取元素列表。
跳跃表
有序集合在生活中比较常见,例如根据成绩对学生排名,根据得分对玩家排名等。对于有序集合的底层实现,可以用数组、平衡树、链表等。数组不便元素的插入、删除;平衡树或红黑树虽然效率高但结构复杂;链表查询需要遍历所有效率低。Redis 采用的是跳跃表,跳跃表效率堪比红黑树,实现远比红黑树简单。
对比有序链表和跳跃表,从链表中查询出 51:
- 有序链表
要查找值为 51 的元素,需要从第一个元素开始依次查找、比较才能找到。共需要 6 次比较。
- 跳跃表
从第 2 层开始,1 节点比 51 节点小,向后比较;
21 节点比 51 节点小,继续向后比较,后面就是 NULL 了,所以从 21 节点向下到第 1 层;
在第 1 层,41 节点比 51 节点小,继续向后,61 节点比 51 节点大,所以从 41 向下;
在第 0 层,51 节点为要查找的节点,节点被找到,共查找 4 次。
从此可以看出跳跃表比有序链表效率要高。