一 存储规范

1.1 Key 规范

Redis 的 Key 一定要规范,这样在遇到问题时,能够进行方便的定位。Redis 属于无 scheme 的 KV 数据库,所以,我们靠约定来建立其 scheme 语义。其好处:

  1. 能够根据某类 key 进行数据清理
  2. 能够根据某类 key 进行数据更新
  3. 能够方面了解到某类 key 的归属方和应用场景
  4. 为统一化、平台化做准备,减少技术变更

规则:

  1. 可读性和可管理性

    1. 业务名(或数据库名)为前缀(防止key冲突):表名(类):变量(key)
    2. 例如
      1. ugc:video:1
  2. 简洁性

    1. 保证语义的前提下,控制key的长度,当key较多时,内存占用也不容忽视,例如:
      1. user:{uid}:friends:messages:{mid}简化为u:{uid}:fr:m:{mid}。
  3. 不要包含特殊字符

    1. 不包含空格、换行、单双引号以及其他转义字符

      1.2 value 规范

  4. 拒绝bigkey(防止网卡流量、慢查询)

    1. 大Key会带来网卡流量风暴和慢查询,一般string类型控制在10KB以内,严禁超过50KB 的单条记录,hash、list、set、zset元素个数不要超过5000。
    2. 反例:一个包含200万个元素的list。
    3. 非字符串的bigkey,不要使用del删除,使用hscan、sscan、zscan方式渐进式删除,同时要注意防止bigkey过期时间自动删除问题(例如一个200万的zset设置1小时过期,会触发del操作,造成阻塞,而且该操作会出现在慢查询中(latency可查)),
  5. 选择合适的数据类型

    1. 例如:实体类型(要合理控制和使用数据结构内存编码优化配置,例如ziplist,但也要注意节省内存和性能之间的平衡)
      1. 反例:
      2. set user:1:name tom
      3. set user:1:age 19
      4. set user:1:favor football
      5. 正例:
      6. hmset user:1 name tom age 19 favor football
  6. 设置合理的过期时间

    1. 建议使用expire设置过期时间(条件允许可以打散过期时间,防止集中过期),不过期的数据重点关注idletime。

      1.3 缓存不能有中间态

      缓存应该仅作缓存用,去掉后业务逻辑不应发生改变,万不可切入到业务里。

      二 命令操作规范

      2.1 禁用命令

      因为redis 提供的一些命令 在数据量很小的情况下,没有影响 ,一大数据量很大的时候会拖垮整个缓存系统,因此很多企业DBA前期要禁用一些高危命令,列如:
  7. Keys 命令效率极低,属于 O(N)操作,会阻塞其他正常命令,在 cluster 上,会是灾难性的操作。严禁使用,DBA 应该 rename 此命令,从根源禁用。

  8. flushall、flushdb 命令会清空所有数据,属于高危操作。严禁使用,DBA 应该 rename 此命令,从根源禁用,仅 DBA 可操作。

    2.2 O(N)命令关注N的数量

    例如hgetall、lrange、smembers、zrange、sinter等并非不能使用,但是需要明确N的值。有遍历的需求可以使用hscan、sscan、zscan代替。

    2.3 禁用 select

    select函数用来切换 database,对于使用方来说,这是很容易发生问题的地方,cluster 模式也不支持多个 database,且没有任何收益,禁用。Redis多数据库支持较弱,多业务用多数据库实际还是单线程处理,会有干扰。最好是拆分使用多个Redis。华为云集群实例不支持多DB。

    2.4 批处理提高效率

  9. 如果有批量操作,可使用mget、mset或pipeline,提高效率,但要注意控制一次批量操作的元素个数。mget、mset和pipeline的区别如下:
    a. mget和mset是原子操作,pipeline是非原子操作。
    b. pipeline可以打包不同的命令,mget和mset做不到。
    c. 使用pipeline,需要客户端和服务端同时支持。

    2.5 lua 脚本注意事项

  10. lua 脚本虽然能做很多看起来很 cool 的事情,但它就像是 SQL 的存储过程,会引入性能和一些难以维护的问题。

  11. lua脚本的执行超时时间为5秒钟,建议不要在lua脚本中使用比较耗时的代码,比如长时间的sleep、大的循环等语句。
  12. 调用lua脚本时,建议不要使用随机函数去指定key,否则在主备节点上执行结果不一致,从而导致主备节点数据不一致。
  13. 集群实例使用lua有如下限制:
    1. 使用EVAL和EVALSHA命令时,命令参数中必须带有至少1个key,否则客户端会提示“ERR eval/evalsha numkeys must be bigger than zero in redis cluster mode”的错误。
    2. 使用EVAL和EVALSHA命令时,DCS Redis集群实例使用第一个key来计算slot,用户代码需要保证操作的key是在同一个slot。

      2.6 禁用 队列&事务

      如没有非常特殊的需求,严禁将 Redis 当作消息队列使用。Redis 当作消息队列使用,会有容量、网络、效率、功能方面的多种问题。如需要消息队列,可使用高吞吐的 Kafka 或者高可靠的 RocketMQ。
      事务交给数据库控制

      三 客户端使用

      3.1 避免多个应用使用一个Redis实例

      正例:不相干的业务拆分,公共数据做服务化。

      3.2 使用连接池

      使用带有连接池的数据库,可以有效控制连接,同时提高效率,标准使用方式:
      1. 执行命令如下:
      2. Jedis jedis = null;
      3. try {
      4. jedis = jedisPool.getResource();
      5. //具体的命令
      6. jedis.executeCommand()
      7. } catch (Exception e) {
      8. logger.error("op key {} error: " + e.getMessage(), key, e);
      9. } finally {
      10. //注意这里不是关闭连接,在JedisPool模式下,Jedis会被归还给资源池。
      11. if (jedis != null)
      12. jedis.close();
      13. }
      下面是JedisPool优化方法的文章:
  • Jedis常见异常汇总
  • JedisPool资源池优化

    3.3 熔断机制

    高并发下建议客户端添加熔断功能(例如netflix hystrix)

    3.4 设置密码

    设置合理的密码,如有必要可以使用SSL加密访问(阿里云Redis支持)

    3.5 选好淘汰策略

    根据自身业务类型,选好maxmemory-policy(最大内存淘汰策略),设置好过期时间。
    默认策略是volatile-lru,即超过最大内存后,在过期键中使用lru算法进行key的剔除,保证不过期数据不被删除,但是可能会出现OOM问题。

    其他策略如下:
  • allkeys-lru:根据LRU算法删除键,不管数据有没有设置超时属性,直到腾出足够空间为止。

  • allkeys-random:随机删除所有键,直到腾出足够空间为止。
  • volatile-random:随机删除过期键,直到腾出足够空间为止。
  • volatile-ttl:根据键值对象的ttl属性,删除最近将要过期数据。如果没有,回退到noeviction策略。
  • noeviction:不会剔除任何数据,拒绝所有写入操作并返回客户端错误信息”(error) OOM command not allowed when used memory”,此时Redis只响应读操作。

    四、相关工具

    4.1 数据同步

    redis间数据同步可以使用:redis-port

    4.2 big key搜索

    redis大key搜索工具

    4.3 热点key寻找(内部实现使用monitor,所以建议短时间使用)

    facebook的redis-faina
    1. 阿里云Redis已经在内核层面解决热点key问题,欢迎使用。

    五 附录:删除bigkey

    ```
  1. 下面操作可以使用pipeline加速。
  2. redis 4.0已经支持key的异步删除,欢迎使用。

    1. <a name="MZXGO"></a>
    2. ## 5.1 Hash删除: hscan + hdel
    3. ```java
    4. public void delBigHash(String host, int port, String password, String bigHashKey) {
    5. Jedis jedis = new Jedis(host, port);
    6. if (password != null && !"".equals(password)) {
    7. jedis.auth(password);
    8. }
    9. ScanParams scanParams = new ScanParams().count(100);
    10. String cursor = "0";
    11. do {
    12. ScanResult<Entry<String, String>> scanResult = jedis.hscan(bigHashKey, cursor, scanParams);
    13. List<Entry<String, String>> entryList = scanResult.getResult();
    14. if (entryList != null && !entryList.isEmpty()) {
    15. for (Entry<String, String> entry : entryList) {
    16. jedis.hdel(bigHashKey, entry.getKey());
    17. }
    18. }
    19. cursor = scanResult.getStringCursor();
    20. } while (!"0".equals(cursor));
    21. //删除bigkey
    22. jedis.del(bigHashKey);
    23. }

    5.2 List删除: ltrim

    1. public void delBigList(String host, int port, String password, String bigListKey) {
    2. Jedis jedis = new Jedis(host, port);
    3. if (password != null && !"".equals(password)) {
    4. jedis.auth(password);
    5. }
    6. long llen = jedis.llen(bigListKey);
    7. int counter = 0;
    8. int left = 100;
    9. while (counter < llen) {
    10. //每次从左侧截掉100个
    11. jedis.ltrim(bigListKey, left, llen);
    12. counter += left;
    13. }
    14. //最终删除key
    15. jedis.del(bigListKey);
    16. }

    5.3 Set删除: sscan + srem

    1. public void delBigSet(String host, int port, String password, String bigSetKey) {
    2. Jedis jedis = new Jedis(host, port);
    3. if (password != null && !"".equals(password)) {
    4. jedis.auth(password);
    5. }
    6. ScanParams scanParams = new ScanParams().count(100);
    7. String cursor = "0";
    8. do {
    9. ScanResult<String> scanResult = jedis.sscan(bigSetKey, cursor, scanParams);
    10. List<String> memberList = scanResult.getResult();
    11. if (memberList != null && !memberList.isEmpty()) {
    12. for (String member : memberList) {
    13. jedis.srem(bigSetKey, member);
    14. }
    15. }
    16. cursor = scanResult.getStringCursor();
    17. } while (!"0".equals(cursor));
    18. //删除bigkey
    19. jedis.del(bigSetKey);
    20. }

    5.4 SortedSet删除: zscan + zrem

    1. public void delBigZset(String host, int port, String password, String bigZsetKey) {
    2. Jedis jedis = new Jedis(host, port);
    3. if (password != null && !"".equals(password)) {
    4. jedis.auth(password);
    5. }
    6. ScanParams scanParams = new ScanParams().count(100);
    7. String cursor = "0";
    8. do {
    9. ScanResult<Tuple> scanResult = jedis.zscan(bigZsetKey, cursor, scanParams);
    10. List<Tuple> tupleList = scanResult.getResult();
    11. if (tupleList != null && !tupleList.isEmpty()) {
    12. for (Tuple tuple : tupleList) {
    13. jedis.zrem(bigZsetKey, tuple.getElement());
    14. }
    15. }
    16. cursor = scanResult.getStringCursor();
    17. } while (!"0".equals(cursor));
    18. //删除bigkey
    19. jedis.del(bigZsetKey);
    20. }