kubernetes 排错指南

白天 夜间 首页 下载 阅读记录
  我的书签   添加书签   移除书签

排错技巧

浏览 139 扫码 分享 2022-07-14 05:02:38
  • 分析 ExitCode 定位 Pod 异常退出原因
  • 容器内抓包定位网络问题
  • 使用 Systemtap 定位疑难杂症

若有收获,就点个赞吧

0 人点赞

上一篇:
下一篇:
  • 书签
  • 添加书签 移除书签
  • Pod 排错
    • 容器进程主动退出
    • Pod 健康检查失败
    • Pod 一直处于 ContainerCreating 或 Waiting 状态
    • Pod 处于 CrashLoopBackOff 状态
    • Pod 一直处于 Error 状态
    • Pod 一直处于 ImageInspectError 状态
    • Pod 一直处于 ImagePullBackOff 状态
    • Pod 一直处于 Pending 状态
    • Pod 一直处于 Terminating 状态
    • Pod 一直处于 Unknown 状态
    • Pod Terminating 慢
  • 节点排错
    • arp_cache: neighbor table overflow! (arp缓存溢出)
    • Cannot allocate memory
    • soft lockup (内核软死锁)
    • no space left on device
  • 其它排错
    • Daemonset 没有被调度
    • Job 无法被删除
    • kubectl 执行 exec 或 logs 失败
    • Namespace 卡在 Terminating
    • Node 全部消失
  • 网络排错
    • 网络排错速查手册
    • DNS 解析异常
    • 网络性能差
    • LB 健康检查失败
    • Service 无法解析
    • Service 不通
  • 处理实践
    • 磁盘爆满
    • arp_cache 溢出
    • 高负载
    • 内存碎片化
    • PID 耗尽
    • inotify watch 耗尽
  • 排错技巧
    • 分析 ExitCode 定位 Pod 异常退出原因
    • 容器内抓包定位网络问题
    • 使用 Systemtap 定位疑难杂症
  • 避坑指南
    • cgroup 泄露
    • .Net Core 配置文件在Kubernetes中无法热加载
    • 使用 oom-guard 在用户态处理 cgroup OOM
    • 使用 NodeLocal DNS (缓存)
    • 解决长连接服务扩容失效
    • tcp_tw_recycle 引发丢包
    • ARP 缓存爆满导致健康检查失败
    • 跨 VPC 访问 NodePort 经常超时
    • DNS 5 秒延时
    • DNS 解析异常
    • 驱逐导致服务中断
    • Pod 访问另一个集群的 apiserver 有延时
    • 神秘的溢出与丢包
    • 访问 externalTrafficPolicy 为 Local 的 Service 对应 LB 有时超时
    • Pod 偶尔存活检查失败
    • LB 压测 NodePort CPS 低
    • 诡异的 No route to host
    • kubectl edit 或者 apply 报 SchemaError
暂无相关搜索结果!

    让时间为你证明

    展开/收起文章目录

    分享,让知识传承更久远

    文章二维码

    手机扫一扫,轻松掌上读

    文档下载

    请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
    PDF文档 EPUB文档 MOBI文档

    书签列表

      阅读记录

      阅读进度: 0.00% ( 0/0 ) 重置阅读进度

        思维导图备注