Kubernetes异常排查方式

集群信息:

bash 复制代码
1. 显示 Kubernetes 版本:kubectl version
2. 显示集群信息:kubectl cluster-info
3. 列出集群中的所有节点:kubectl get nodes
4. 查看一个具体的节点详情:kubectl describe node <node-name>
5. 列出所有命名空间:kubectl get namespaces
6. 列出所有命名空间中的所有 pod:kubectl get pods --all-namespaces

Pod 诊断:

bash 复制代码
1. 列出特定命名空间中的 pod:kubectl get pods -n <namespace>
2. 查看一个 Pod 详情:kubectl describe pod <pod-name> -n <namespace>
3. 查看 Pod 日志:kubectl logs <pod-name> -n <namespace>
4. 尾部 Pod 日志:kubectl logs -f <pod-name> -n <namespace>
5. 在 pod 中执行命令:kubectl exec -it <pod-name> -n <namespace> -- <command>

Pod 健康检查:

bash 复制代码
1. 检查 Pod 准备情况:kubectl get pods <pod-name> -n <namespace> -o jsonpath='{.status.conditions[?(@.type=="Ready")].status}'
2. 检查 Pod 事件:kubectl get events -n <namespace> --field-selector involvedObject.name=<pod-name>

Service诊断:

bash 复制代码
1. 列出命名空间中的所有服务:kubectl get svc -n <namespace>
2. 查看一个服务详情:kubectl describe svc <service-name> -n <namespace>

Deployment诊断:

bash 复制代码
1. 列出命名空间中的所有Deployment:kubectl get deployments -n <namespace>
2. 查看一个Deployment详情:kubectl describe deployment <deployment-name> -n <namespace>
3. 查看滚动发布状态:kubectl rollout status deployment/<deployment-name> -n <namespace>
4. 查看滚动发布历史记录:kubectl rollout history deployment/<deployment-name> -n <namespace>

StatefulSet诊断:

bash 复制代码
1. 列出命名空间中的所有 StatefulSet:kubectl get statefulsets -n <namespace>
2. 查看一个 StatefulSet详情:kubectl describe statefulset <statefulset-name> -n <namespace>

ConfigMap 和Secret诊断:

bash 复制代码
1. 列出命名空间中的 ConfigMap:kubectl get configmaps -n <namespace>
2. 查看一个ConfigMap详情:kubectl describe configmap <configmap-name> -n <namespace>
3. 列出命名空间中的 Secret:kubectl get secrets -n <namespace>
4. 查看一个Secret详情:kubectl describe secret <secret-name> -n <namespace>

命名空间诊断:

bash 复制代码
1. 查看一个命名空间详情:kubectl describe namespace <namespace-name>

资源使用情况:

bash 复制代码
1. 检查 pod 的资源使用情况:kubectl top pod <pod-name> -n <namespace>
2. 检查节点资源使用情况:kubectl top nodes

网络诊断:

bash 复制代码
1. 显示命名空间中 Pod 的 IP 地址:kubectl get pods -n <namespace> -o custom-columns=POD:metadata.name,IP:status.podIP --no-headers
2. 列出命名空间中的所有网络策略:kubectl get networkpolicies -n <namespace>
3. 查看一个网络策略详情:kubectl describe networkpolicy <network-policy-name> -n <namespace>

持久卷 (PV) 和持久卷声明 (PVC) 诊断:

bash 复制代码
1. 列出PV:kubectl get pv
2. 查看一个PV详情:kubectl describe pv <pv-name>
3. 列出命名空间中的 PVC:kubectl get pvc -n <namespace>
4. 查看PVC详情:kubectl describe pvc <pvc-name> -n <namespace>

节点诊断:

bash 复制代码
1. 获取特定节点上运行的 Pod 列表:kubectl get pods --field-selector spec.nodeName=<node-name> -n <namespace>

资源配额和限制:

bash 复制代码
1. 列出命名空间中的资源配额:kubectl get resourcequotas -n <namespace>
2. 查看一个资源配额详情:kubectl describe resourcequota <resource-quota-name> -n <namespace>

自定义资源定义 (CRD) 诊断:

bash 复制代码
1. 列出命名空间中的自定义资源:kubectl get <custom-resource-name> -n <namespace>
2. 查看自定义资源详情:kubectl describe <custom-resource-name> <custom-resource-instance-name> -n <namespace>

资源伸缩和自动伸缩

bash 复制代码
1. Deployment伸缩:kubectl scale deployment <deployment-name> --replicas=<replica-count> -n <namespace>
2. 设置Deployment的自动伸缩:kubectl autoscale deployment <deployment-name> --min=<min-pods> --max=<max-pods> --cpu-percent=<cpu-percent> -n <namespace>
3. 检查水平伸缩器状态:kubectl get hpa -n <namespace>

作业和 CronJob 诊断:

bash 复制代码
1. 列出命名空间中的所有作业:kubectl get jobs -n <namespace>
2. 查看一份工作详情:kubectl describe job <job-name> -n <namespace>
3. 列出命名空间中的所有 cron 作业:kubectl get cronjobs -n <namespace>
4. 查看一个 cron 作业详情:kubectl describe cronjob <cronjob-name> -n <namespace>

容量诊断:

bash 复制代码
1. 列出按容量排序的持久卷 (PV):kubectl get pv --sort-by=.spec.capacity.storage
2. 查看PV回收策略:kubectl get pv <pv-name> -o=jsonpath='{.spec.persistentVolumeReclaimPolicy}'
3. 列出所有存储类别:kubectl get storageclasses

Ingress和服务网格诊断:

bash 复制代码
1. 列出命名空间中的所有Ingress:kubectl get ingress -n <namespace>
2. 查看一个Ingress详情:kubectl describe ingress <ingress-name> -n <namespace>
3. 列出命名空间中的所有 VirtualServices (Istio):kubectl get virtualservices -n <namespace>
4. 查看一个 VirtualService (Istio)详情:kubectl describe virtualservice <virtualservice-name> -n <namespace>

Pod 网络故障排除:

bash 复制代码
1. 运行网络诊断 Pod(例如 busybox)进行调试:kubectl run -it --rm --restart=Never --image=busybox net-debug-pod -- /bin/sh
2. 测试从 Pod 到特定端点的连接:kubectl exec -it <pod-name> -n <namespace> -- curl <endpoint-url>
3. 跟踪从一个 Pod 到另一个 Pod 的网络路径:kubectl exec -it <source-pod-name> -n <namespace> -- traceroute <destination-pod-ip>
4. 检查 Pod 的 DNS 解析:kubectl exec -it <pod-name> -n <namespace> -- nslookup <domain-name>
相关推荐
2201_7611990437 分钟前
nginx 负载均衡1
linux·运维·服务器·nginx·负载均衡
suri ..42 分钟前
【Linux】进程第三弹(虚拟地址空间)
linux·运维·服务器
害羞的白菜42 分钟前
Nginx基础详解5(nginx集群、四七层的负载均衡、Jmeter工具的使用、实验验证集群的性能与单节点的性能)
linux·运维·笔记·jmeter·nginx·centos·负载均衡
纪伊路上盛名在42 分钟前
如何初步部署自己的服务器,达到生信分析的及格线
linux·运维·服务器·python·学习·r语言·github
Betty’s Sweet1 小时前
[Linux]:线程(三)
linux·线程·信号量·生产者消费者模型
程序员南飞3 小时前
ps aux | grep smart_webrtc这条指令代表什么意思
java·linux·ubuntu·webrtc
StrokeAce3 小时前
linux桌面软件(wps)内嵌到主窗口后的关闭问题
linux·c++·qt·wps·窗口内嵌
热爱嵌入式的小许7 小时前
Linux基础项目开发1:量产工具——显示系统
linux·运维·服务器·韦东山量产工具
福大大架构师每日一题11 小时前
22.1 k8s不同role级别的服务发现
容器·kubernetes·服务发现
韩楚风11 小时前
【linux 多进程并发】linux进程状态与生命周期各阶段转换,进程状态查看分析,助力高性能优化
linux·服务器·性能优化·架构·gnu