Redis 性能监控

监控指标

  • 性能指标:Performance
  • 内存指标: Memory
  • 基本活动指标:Basic activity
  • 持久性指标: Persistence
  • 错误指标:Error

    性能指标:Performance

    | Name | Description | | —- | —- | | latency | Redis响应一个请求的时间 | | instantaneous_ops_per_sec | 平均每秒处理请求总数 | | hi rate(calculated) | 缓存命中率(计算出来的 |

内存指标: Memory

Name Description
used_memory 已使用内存
mem_fragmentation_ratio 内存碎片率
evicted_keys 由于最大内存限制被移除的key的数量
blocked_clients 由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端

基本活动指标:Basic activity

Name Description
connected_clients 客户端连接数
conected_laves slave数量
master_last_io_seconds_ago 最近一次主从交互之后的秒数
keyspace 数据库中的key值总数

持久性指标: Persistence

Name Description
rdb_last_save_time 最后一次持久化保存磁盘的时间戳
rdb_changes_sice_last_save 自最后一次持久化以来数据库的更改数

错误指标:Error

Name Description
rejected_connections 由于达到maxclient限制而被拒绝的连接数
keyspace_misses key值查找失败(没有命中)次数
master_link_down_since_seconds 主从断开的持续时间(以秒为单位)

监控方式

  • redis-benchmark
  • redis-stat
  • redis-faina
  • redislive
  • redis-cli
  • monitor
  • showlog
  1. get:获取慢查询日志
  2. len:获取慢查询日志条目数
  3. reset:重置慢查询日志

相关配置:

  1. slowlog-log-slower-than 1000 # 设置慢查询的时间下线,单位:微秒
  2. slowlog-max-len 100 # 设置慢查询命令对应的日志显示长度,单位:命令数

info(可以一次性获取所有的信息,也可以按块获取信息)

  1. server:服务器运行的环境参数
  2. clients:客户端相关信息
  3. memory:服务器运行内存统计数据
  4. persistence:持久化信息
  5. stats:通用统计数据
  6. Replication:主从复制相关信息
  7. CPU:CPU使用情况
  8. cluster:集群信息
  9. Keypass:键值对统计数量信息

终端info命令使用

  1. ./redis-cli info 按块获取信息 | grep 需要过滤的参数
  2. ./redis-cli info stats | grep ops

交互式info命令使用

  1. #./redis-cli
  2. > info server

性能监控-info

  1. redis-cli info | grep ops # 每秒操作数

内存监控

  1. [root@iZuligp6e1dyzfZ bin 10:28]# ./redis-cli info | grep used | grep human
  2. used_memory_human:846.52K
  3. used_memory_rss_human:6.41M
  4. used_memory_peak_human:846.55K
  5. used_memory_lua_human:37.00K
  6. used_memory_scripts_human:0B

由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端

  1. [root@iZuligp6e1dyzfZ bin 10:28]# ./redis-cli info | grep blocked_clients
  2. blocked_clients:0

由于最大内存限制被移除的key的数量

  1. [root@iZuligp6e1dyzfZ bin 10:28]# ./redis-cli info | grep evicted_keys
  2. evicted_keys:0

内存碎片率

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep mem_fragmentation_ratio
  2. mem_fragmentation_ratio:8.35

已使用内存

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep used_memory:
  2. used_memory:866840

基本活动指标

redis连接了多少客户端 通过观察其数量可以确认是否存在意料之外的连接。如果发现数量不对劲,就可以使用lcient list指令列出所有的客户端链接地址来确定源头。

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep connected_clients
  2. connected_clients:1
  1. [root@iZuligp6e1dyzfZ bin 10:29]#./redis-cli info | grep connected
  2. connected_clients:1 # 客户端连接数量
  3. connected_slaves:1 # slave连接数量

持久性指标

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep rdb_last_save_time
  2. rdb_last_save_time:1591876204 # 最后一次持久化保存磁盘的时间戳
  3. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep rdb_changes_since_last_save
  4. rdb_changes_since_last_save:0 # 自最后一次持久化以来数据库的更改数

错误指标

由于超出最大连接数限制而被拒绝的客户端连接次数,如果这个数字很大,则意味着服务器的最大连接数设置得过低,需要调整maxclients

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep connected_clients
  2. connected_clients:1

key值查找失败(没有命中)次数,出现多次可能是被hei ke gong ji

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep keyspace
  2. keyspace_misses:0

主从断开的持续时间(以秒为单位)

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep rdb_changes_since_last_save
  2. rdb_changes_since_last_save:0

复制积压缓冲区如果设置得太小,会导致里面的指令被覆盖掉找不到偏移量,从而触发全量同步

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep backlog_size
  2. repl_backlog_size:1048576

通过查看sync_partial_err变量的次数来决定是否需要扩大积压缓冲区,它表示主从半同步复制失败的次数

  1. [root@iZuligp6e1dyzfZ bin 10:29]# ./redis-cli info | grep sync_partial_err
  2. sync_partial_err:1

redis性能测试命令

image.png

  1. ./redis-benchmark -c 100 -n 5000