• 错误预算
    • 运维手册
    • N+2部署实例:更新过程中1个不可用,物理机出现故障一个不可用
    • 可用性目标:快速发展与可用性成反比
    • SLA 服务质量协议、SLO 服务质量目标(SLA-惩罚性条款=SLO)、SLI 服务质量指标
    • SLI 指标:可用性、延迟、吞吐量等
    • 控制手段:建立SLI,对比SLO,如果指标发生变化并达到一定值,是否采取某种手段,以避免超过SLO。
    • Snippets:工作片段,每周的无固定格式工作总结(我的建议200字以下,突出重点)
    • 监控的黄金指标:延迟、流量、饱和度、错误
    • CICD:每个公司都应该制定自己的发布政策