- 错误预算
- 运维手册
- N+2部署实例:更新过程中1个不可用,物理机出现故障一个不可用
- 可用性目标:快速发展与可用性成反比
- SLA 服务质量协议、SLO 服务质量目标(SLA-惩罚性条款=SLO)、SLI 服务质量指标
- SLI 指标:可用性、延迟、吞吐量等
- 控制手段:建立SLI,对比SLO,如果指标发生变化并达到一定值,是否采取某种手段,以避免超过SLO。
- Snippets:工作片段,每周的无固定格式工作总结(我的建议200字以下,突出重点)
- 监控的黄金指标:延迟、流量、饱和度、错误
- CICD:每个公司都应该制定自己的发布政策
