alertmanager.yaml

    1. # 全局配置
    2. global:
    3. resolve_timeout: 5m
    4. # 路由配置
    5. route:
    6. # 根据那一个标签 对报警进行分组
    7. group_by: ['alertname']
    8. # 分组后 等待10s 来初始化通知
    9. group_wait: 10s
    10. # 报警分组创建后 等待10s 来初始化通知
    11. group_interval: 10s
    12. # 同一个报警信息 等待多久再次发送
    13. repeat_interval: 30m
    14. # 默认接收器
    15. receiver: 'web.hook'
    16. # 匹配 team标签为node 的告警 使用 email接收者
    17. routes:
    18. # 通过标签匹配 告警
    19. - match:
    20. team: node
    21. receiver: 'dingding'
    22. # 通过正则 匹配告警标签
    23. - match_re:
    24. service: ^(foo1|foo2)$
    25. # 定义 接收者
    26. receivers:
    27. - name: 'web.hook'
    28. webhook_configs:
    29. - url: 'http://127.0.0.1:5001/'
    30. - name: 'dingding'
    31. webhook_configs:
    32. - url: 'http://127.0.0.1:5001/'
    33. send_resolved: true
    34. # 告警抑制配置
    35. inhibit_rules:
    36. # 当多个告警alertname/dev/instance三个标签值相等时
    37. # 同时 如果存在 serverity:critical标签的告警 则 抑制serverity:warning标签的告警
    38. - source_match:
    39. severity: 'critical'
    40. target_match:
    41. severity: 'warning'
    42. equal: ['alertname', 'dev', 'instance']