1 监控指标

1.1 集群监控

  • 节点资源利用率
  • 节点数
  • 运行Pod

1.2 Pod监控

  • 容器指标
  • 应用程序

2 监控平台

2.1 prometheus + Grafana

2.1.1 prometheus

  • 开源的
  • 监控、报警、数据库
  • 以http协议周期性抓取被监控组件状态
  • 不需要复杂的集成过程,使用http接接入就可以了

2.1.2 Grafana

  • 开源的数据分析和可视化工具
  • 支持多种数据源

2.1.3 搭建实现(TODO)