:::info 演示视频 https://www.bilibili.com/video/BV1vS4y1d7Lf/ :::

email

配置 alert

  • Contact points

配置报警方式

  • alert rules

配置报警规则: 达到什么条件报警

  • Notification policies
  • 通知政策: 什么规则用什么报警方式

    开启 ngalert 后的配置界面

image.png

配置 smtp

编辑 grafana.ini 找到 smtp 段

image.png

主机指标报警

CPU

  1. # cpu 使用率
  2. (((count(count(node_cpu_seconds_total{instance="192.168.52.201:9100"}) by (cpu))) - avg(sum by (mode)(rate(node_cpu_seconds_total{mode='idle',instance="192.168.52.201:9100"}[1m])))) * 100) / count(count(node_cpu_seconds_total{instance="192.168.52.201:9100"}) by (cpu))

内存

# 通过 instance 过滤不同服务器
((node_memory_MemTotal_bytes{instance="192.168.52.201:9100"} - node_memory_MemFree_bytes{instance="192.168.52.201:9100"}) / (node_memory_MemTotal_bytes{instance="192.168.52.201:9100"} )) * 100

硬盘

# 硬盘 / 使用率
100 - ((node_filesystem_avail_bytes{instance="192.168.52.201:9100",device="/dev/mapper/centos-root"} * 100) / node_filesystem_size_bytes{instance="192.168.52.201:9100",device="/dev/mapper/centos-root"})

网络

容器指标报警

资源占用过多

restart

日志中 Error