- 集群信息">集群信息
- Pod 诊断">Pod 诊断
- Pod 健康检查">Pod 健康检查
- Service诊断">Service诊断
- Deployment诊断">Deployment诊断
- StatefulSet诊断">StatefulSet诊断
- ConfigMap 和Secret诊断">ConfigMap 和Secret诊断
- 命名空间诊断">命名空间诊断
- 资源使用情况">资源使用情况
- 网络诊断">网络诊断
- 持久卷 (PV) 和持久卷声明 (PVC) 诊断">持久卷 (PV) 和持久卷声明 (PVC) 诊断
- 节点诊断">节点诊断
- 资源配额和限制">资源配额和限制
- 自定义资源定义 (CRD) 诊断">自定义资源定义 (CRD) 诊断
- 资源伸缩和自动伸缩">资源伸缩和自动伸缩
- 作业和 CronJob 诊断">作业和 CronJob 诊断
- 容量诊断">容量诊断
- Ingress和服务网格诊断">Ingress和服务网格诊断
- Pod 网络故障排除">Pod 网络故障排除
- 配置和资源验证">配置和资源验证
- RBAC 和安全性">RBAC 和安全性
- 服务帐户诊断">服务帐户诊断
- 清空节点和解除封锁">清空节点和解除封锁
- 资源清理">资源清理
- Pod 亲和性和反亲和性">Pod 亲和性和反亲和性
- Pod 安全策略 (PSP)">Pod 安全策略 (PSP)
- 事件">事件
- 节点故障排除">节点故障排除
- 临时容器(Kubernetes 1.18+)">临时容器(Kubernetes 1.18+)
- 资源指标(需要指标服务器)">资源指标(需要指标服务器)
- kuelet诊断">kuelet诊断
- 使用Telepresence 进行高级调试">使用Telepresence 进行高级调试
- Kubeconfig 和上下文">Kubeconfig 和上下文
- Pod 安全标准(PodSecurity 准入控制器)">Pod 安全标准(PodSecurity 准入控制器)
- Pod 中断预算 (PDB) 诊断">Pod 中断预算 (PDB) 诊断
- 资源锁诊断(如果使用资源锁)">资源锁诊断(如果使用资源锁)
- 服务端点和 DNS">服务端点和 DNS
- 自定义指标(Prometheus、Grafana)">自定义指标(Prometheus、Grafana)
- Pod 优先级和抢占">Pod 优先级和抢占
- Pod 开销(Kubernetes 1.18+)">Pod 开销(Kubernetes 1.18+)
- 存储卷快照诊断(如果使用存储卷快照)">存储卷快照诊断(如果使用存储卷快照)
- 资源反序列化诊断">资源反序列化诊断
- 节点污点">节点污点
- 更改和验证 Webhook 配置">更改和验证 Webhook 配置
- Pod 网络策略">Pod 网络策略
- 节点条件(Kubernetes 1.17+)">节点条件(Kubernetes 1.17+)
- 审核日志">审核日志
- 节点操作系统详细信息">节点操作系统详细信息
这里列出了 100 个 Kubectl 命令,这些命令对于诊断 Kubernetes 集群中的问题非常有用。这些问题包括但不限于:
- 集群信息
- Pod 诊断
- 服务诊断
- 部署诊断
- 网络诊断
- 持久卷和持久卷声明诊断
- 资源使用情况
- 安全和授权
- 节点故障排除
- 其他诊断命令:文章还提到了许多其他命令,如资源扩展和自动扩展、作业和定时作业诊断、Pod 亲和性和反亲和性规则、RBAC 和安全、服务账号诊断、节点排空和取消排空、资源清理等。
集群信息
- 显示 Kubernetes 版本:
<font style="color:rgb(221, 17, 68);">kubectl version</font>
- 显示集群信息:
<font style="color:rgb(221, 17, 68);">kubectl cluster-info</font>
- 列出集群中的所有节点:
<font style="color:rgb(221, 17, 68);">kubectl get nodes</font>
- 查看一个具体的节点详情:
<font style="color:rgb(221, 17, 68);">kubectl describe node <node-name></font>
- 列出所有命名空间:
<font style="color:rgb(221, 17, 68);">kubectl get namespaces</font>
- 列出所有命名空间中的所有 pod:
<font style="color:rgb(221, 17, 68);">kubectl get pods --all-namespaces</font>
Pod 诊断
- 列出特定命名空间中的 pod:
<font style="color:rgb(221, 17, 68);">kubectl get pods -n <namespace></font>
- 查看一个 Pod 详情:
<font style="color:rgb(221, 17, 68);">kubectl describe pod <pod-name> -n <namespace></font>
- 查看 Pod 日志:
<font style="color:rgb(221, 17, 68);">kubectl logs <pod-name> -n <namespace></font>
- 尾部 Pod 日志:
<font style="color:rgb(221, 17, 68);">kubectl logs -f <pod-name> -n <namespace></font>
- 在 pod 中执行命令:
<font style="color:rgb(221, 17, 68);">kubectl exec -it <pod-name> -n <namespace> -- <command></font>
Pod 健康检查
- 检查 Pod 准备情况:
<font style="color:rgb(221, 17, 68);">kubectl get pods <pod-name> -n <namespace> -o jsonpath='{.status.conditions[?(@.type=="Ready")].status}'</font>
- 检查 Pod 事件:
<font style="color:rgb(221, 17, 68);">kubectl get events -n <namespace> --field-selector involvedObject.name=<pod-name></font>
Service诊断
- 列出命名空间中的所有服务:
<font style="color:rgb(221, 17, 68);">kubectl get svc -n <namespace></font>
- 查看一个服务详情:
<font style="color:rgb(221, 17, 68);">kubectl describe svc <service-name> -n <namespace></font>
Deployment诊断
- 列出命名空间中的所有Deployment:
<font style="color:rgb(221, 17, 68);">kubectl get deployments -n <namespace></font>
- 查看一个Deployment详情:
<font style="color:rgb(221, 17, 68);">kubectl describe deployment <deployment-name> -n <namespace></font>
- 查看滚动发布状态:
<font style="color:rgb(221, 17, 68);">kubectl rollout status deployment/<deployment-name> -n <namespace></font>
- 查看滚动发布历史记录:
<font style="color:rgb(221, 17, 68);">kubectl rollout history deployment/<deployment-name> -n <namespace></font>
StatefulSet诊断
- 列出命名空间中的所有 StatefulSet:
<font style="color:rgb(221, 17, 68);">kubectl get statefulsets -n <namespace></font>
- 查看一个 StatefulSet详情:
<font style="color:rgb(221, 17, 68);">kubectl describe statefulset <statefulset-name> -n <namespace></font>
ConfigMap 和Secret诊断
- 列出命名空间中的 ConfigMap:
<font style="color:rgb(221, 17, 68);">kubectl get configmaps -n <namespace></font>
- 查看一个ConfigMap详情:
<font style="color:rgb(221, 17, 68);">kubectl describe configmap <configmap-name> -n <namespace></font>
- 列出命名空间中的 Secret:
<font style="color:rgb(221, 17, 68);">kubectl get secrets -n <namespace></font>
- 查看一个Secret详情:
<font style="color:rgb(221, 17, 68);">kubectl describe secret <secret-name> -n <namespace></font>
命名空间诊断
- 查看一个命名空间详情:
<font style="color:rgb(221, 17, 68);">kubectl describe namespace <namespace-name></font>
资源使用情况
- 检查 pod 的资源使用情况:
<font style="color:rgb(221, 17, 68);">kubectl top pod <pod-name> -n <namespace></font>
- 检查节点资源使用情况:
<font style="color:rgb(221, 17, 68);">kubectl top nodes</font>
网络诊断
- 显示命名空间中 Pod 的 IP 地址:
<font style="color:rgb(221, 17, 68);">kubectl get pods -n <namespace> -o custom-columns=POD:metadata.name,IP:status.podIP --no-headers</font>
- 列出命名空间中的所有网络策略:
<font style="color:rgb(221, 17, 68);">kubectl get networkpolicies -n <namespace></font>
- 查看一个网络策略详情:
<font style="color:rgb(221, 17, 68);">kubectl describe networkpolicy <network-policy-name> -n <namespace></font>
持久卷 (PV) 和持久卷声明 (PVC) 诊断
- 列出PV:
<font style="color:rgb(221, 17, 68);">kubectl get pv</font>
- 查看一个PV详情:
<font style="color:rgb(221, 17, 68);">kubectl describe pv <pv-name></font>
- 列出命名空间中的 PVC:
<font style="color:rgb(221, 17, 68);">kubectl get pvc -n <namespace></font>
- 查看PVC详情:
<font style="color:rgb(221, 17, 68);">kubectl describe pvc <pvc-name> -n <namespace></font>
节点诊断
- 获取特定节点上运行的 Pod 列表:
<font style="color:rgb(221, 17, 68);">kubectl get pods --field-selector spec.nodeName=<node-name> -n <namespace></font>
资源配额和限制
- 列出命名空间中的资源配额:
<font style="color:rgb(221, 17, 68);">kubectl get resourcequotas -n <namespace></font>
- 查看一个资源配额详情:
<font style="color:rgb(221, 17, 68);">kubectl describe resourcequota <resource-quota-name> -n <namespace></font>
自定义资源定义 (CRD) 诊断
- 列出命名空间中的自定义资源:
<font style="color:rgb(221, 17, 68);">kubectl get <custom-resource-name> -n <namespace></font>
- 查看自定义资源详情:
<font style="color:rgb(221, 17, 68);">kubectl describe <custom-resource-name> <custom-resource-instance-name> -n <namespace></font>
资源伸缩和自动伸缩
- Deployment伸缩:
<font style="color:rgb(221, 17, 68);">kubectl scale deployment <deployment-name> --replicas=<replica-count> -n <namespace></font>
- 设置Deployment的自动伸缩:
<font style="color:rgb(221, 17, 68);">kubectl autoscale deployment <deployment-name> --min=<min-pods> --max=<max-pods> --cpu-percent=<cpu-percent> -n <namespace></font>
- 检查水平伸缩器状态:
<font style="color:rgb(221, 17, 68);">kubectl get hpa -n <namespace></font>
作业和 CronJob 诊断
- 列出命名空间中的所有作业:
<font style="color:rgb(221, 17, 68);">kubectl get jobs -n <namespace></font>
- 查看一份工作详情:
<font style="color:rgb(221, 17, 68);">kubectl describe job <job-name> -n <namespace></font>
- 列出命名空间中的所有 cron 作业:
<font style="color:rgb(221, 17, 68);">kubectl get cronjobs -n <namespace></font>
- 查看一个 cron 作业详情:
<font style="color:rgb(221, 17, 68);">kubectl describe cronjob <cronjob-name> -n <namespace></font>
容量诊断
- 列出按容量排序的持久卷 (PV):
<font style="color:rgb(221, 17, 68);">kubectl get pv --sort-by=.spec.capacity.storage</font>
- 查看PV回收策略:
<font style="color:rgb(221, 17, 68);">kubectl get pv <pv-name> -o=jsonpath='{.spec.persistentVolumeReclaimPolicy}'</font>
- 列出所有存储类别:
<font style="color:rgb(221, 17, 68);">kubectl get storageclasses</font>
Ingress和服务网格诊断
- 列出命名空间中的所有Ingress:
<font style="color:rgb(221, 17, 68);">kubectl get ingress -n <namespace></font>
- 查看一个Ingress详情:
<font style="color:rgb(221, 17, 68);">kubectl describe ingress <ingress-name> -n <namespace></font>
- 列出命名空间中的所有 VirtualServices (Istio):
<font style="color:rgb(221, 17, 68);">kubectl get virtualservices -n <namespace></font>
- 查看一个 VirtualService (Istio)详情:
<font style="color:rgb(221, 17, 68);">kubectl describe virtualservice <virtualservice-name> -n <namespace></font>
Pod 网络故障排除
- 运行网络诊断 Pod(例如 busybox)进行调试:
<font style="color:rgb(221, 17, 68);">kubectl run -it --rm --restart=Never --image=busybox net-debug-pod -- /bin/sh</font>
- 测试从 Pod 到特定端点的连接:
<font style="color:rgb(221, 17, 68);">kubectl exec -it <pod-name> -n <namespace> -- curl <endpoint-url></font>
- 跟踪从一个 Pod 到另一个 Pod 的网络路径:
<font style="color:rgb(221, 17, 68);">kubectl exec -it <source-pod-name> -n <namespace> -- traceroute <destination-pod-ip></font>
- 检查 Pod 的 DNS 解析:
<font style="color:rgb(221, 17, 68);">kubectl exec -it <pod-name> -n <namespace> -- nslookup <domain-name></font>
配置和资源验证
- 验证 Kubernetes YAML 文件而不应用它:
<font style="color:rgb(221, 17, 68);">kubectl apply --dry-run=client -f <yaml-file></font>
- 验证 pod 的安全上下文和功能:
<font style="color:rgb(221, 17, 68);">kubectl auth can-i list pods --as=system:serviceaccount:<namespace>:<serviceaccount-name></font>
RBAC 和安全性
- 列出命名空间中的角色和角色绑定:
<font style="color:rgb(221, 17, 68);">kubectl get roles,rolebindings -n <namespace></font>
- 查看角色或角色绑定详情:
<font style="color:rgb(221, 17, 68);">kubectl describe role <role-name> -n <namespace></font>
服务帐户诊断
- 列出命名空间中的服务帐户:
<font style="color:rgb(221, 17, 68);">kubectl get serviceaccounts -n <namespace></font>
- 查看一个服务帐户详情:
<font style="color:rgb(221, 17, 68);">kubectl describe serviceaccount <serviceaccount-name> -n <namespace></font>
清空节点和解除封锁
- 清空节点以进行维护:
<font style="color:rgb(221, 17, 68);">kubectl drain <node-name> --ignore-daemonsets</font>
- 解除对节点的封锁:
<font style="color:rgb(221, 17, 68);">kubectl uncordon <node-name></font>
资源清理
- 强制删除 pod(不推荐):
<font style="color:rgb(221, 17, 68);">kubectl delete pod <pod-name> -n <namespace> --grace-period=0 --force</font>
Pod 亲和性和反亲和性
- 列出 pod 的 pod 亲和性规则:
<font style="color:rgb(221, 17, 68);">kubectl get pod <pod-name> -n <namespace> -o=jsonpath='{.spec.affinity}'</font>
- 列出 pod 的 pod 反亲和性规则:
<font style="color:rgb(221, 17, 68);">kubectl get pod <pod-name> -n <namespace> -o=jsonpath='{.spec.affinity.podAntiAffinity}'</font>
Pod 安全策略 (PSP)
- 列出所有 Pod 安全策略(如果启用):
<font style="color:rgb(221, 17, 68);">kubectl get psp</font>
事件
- 查看最近的集群事件:
<font style="color:rgb(221, 17, 68);">kubectl get events --sort-by=.metadata.creationTimestamp</font>
- 按特定命名空间过滤事件:
<font style="color:rgb(221, 17, 68);">kubectl get events -n <namespace></font>
节点故障排除
- 检查节点情况:
<font style="color:rgb(221, 17, 68);">kubectl describe node <node-name> | grep Conditions -A5</font>
- 列出节点容量和可分配资源:
<font style="color:rgb(221, 17, 68);">kubectl describe node <node-name> | grep -E "Capacity|Allocatable"</font>
临时容器(Kubernetes 1.18+)
- 运行临时调试容器:
<font style="color:rgb(221, 17, 68);">kubectl debug -it <pod-name> -n <namespace> --image=<debug-image> -- /bin/sh</font>
资源指标(需要指标服务器)
- 获取 Pod 的 CPU 和内存使用情况:
<font style="color:rgb(221, 17, 68);">kubectl top pod -n <namespace></font>
kuelet诊断
- 查看节点上的kubelet日志:
<font style="color:rgb(221, 17, 68);">kubectl logs -n kube-system kubelet-<node-name></font>
使用Telepresence 进行高级调试
- 使用 Telepresence 调试 pod:
<font style="color:rgb(221, 17, 68);">telepresence --namespace <namespace> --swap-deployment <pod-name></font>
Kubeconfig 和上下文
- 列出可用的上下文:
<font style="color:rgb(221, 17, 68);">kubectl config get-contexts</font>
- 切换到不同的上下文:
<font style="color:rgb(221, 17, 68);">kubectl config use-context <context-name></font>
Pod 安全标准(PodSecurity 准入控制器)
- 列出 PodSecurityPolicy (PSP) 违规行为:
<font style="color:rgb(221, 17, 68);">kubectl get psp -A | grep -vE 'NAME|REVIEWED'</font>
Pod 中断预算 (PDB) 诊断
- 列出命名空间中的所有 PDB:
<font style="color:rgb(221, 17, 68);">kubectl get pdb -n <namespace></font>
- 查看一个PDB详情:
<font style="color:rgb(221, 17, 68);">kubectl describe pdb <pdb-name> -n <namespace></font>
资源锁诊断(如果使用资源锁)
- 列出命名空间中的资源锁:
<font style="color:rgb(221, 17, 68);">kubectl get resourcelocks -n <namespace></font>
服务端点和 DNS
- 列出服务的服务端点:
<font style="color:rgb(221, 17, 68);">kubectl get endpoints <service-name> -n <namespace></font>
- 检查 Pod 中的 DNS 配置:
<font style="color:rgb(221, 17, 68);">kubectl exec -it <pod-name> -n <namespace> -- cat /etc/resolv.conf</font>
自定义指标(Prometheus、Grafana)
- 查询Prometheus指标:用于
<font style="color:rgb(221, 17, 68);">kubectl port-forward</font>
访问Prometheus和Grafana服务来查询自定义指标。
Pod 优先级和抢占
- 列出优先级:
<font style="color:rgb(221, 17, 68);">kubectl get priorityclasses</font>
Pod 开销(Kubernetes 1.18+)
- 列出 pod 中的开销:
<font style="color:rgb(221, 17, 68);">kubectl get pod <pod-name> -n <namespace> -o=jsonpath='{.spec.overhead}'</font>
存储卷快照诊断(如果使用存储卷快照)
- 列出存储卷快照:
<font style="color:rgb(221, 17, 68);">kubectl get volumesnapshot -n <namespace></font>
- 查看存储卷快照详情:
<font style="color:rgb(221, 17, 68);">kubectl describe volumesnapshot <snapshot-name> -n <namespace></font>
资源反序列化诊断
- 反序列化并打印 Kubernetes 资源:
<font style="color:rgb(221, 17, 68);">kubectl get <resource-type> <resource-name> -n <namespace> -o=json</font>
节点污点
- 列出节点污点:
<font style="color:rgb(221, 17, 68);">kubectl describe node <node-name> | grep Taints</font>
更改和验证 Webhook 配置
- 列出变异 webhook 配置:
<font style="color:rgb(221, 17, 68);">kubectl get mutatingwebhookconfigurations</font>
- 列出验证 Webhook 配置:
<font style="color:rgb(221, 17, 68);">kubectl get validatingwebhookconfigurations</font>
Pod 网络策略
- 列出命名空间中的 pod 网络策略:
<font style="color:rgb(221, 17, 68);">kubectl get networkpolicies -n <namespace></font>
节点条件(Kubernetes 1.17+)
- 自定义查询输出:
<font style="color:rgb(221, 17, 68);">kubectl get nodes -o custom-columns=NODE:.metadata.name,READY:.status.conditions[?(@.type=="Ready")].status -l 'node-role.kubernetes.io/worker='</font>
审核日志
- 检索审核日志(如果启用):检查 Kubernetes 审核日志配置以了解审核日志的位置。
节点操作系统详细信息
- 获取节点的操作系统信息:
<font style="color:rgb(221, 17, 68);">kubectl get node <node-name> -o jsonpath='{.status.nodeInfo.osImage}'</font>