K8S定位POD启动失败问题- status Unknown

遇到了Pod启动失败(用于网络检查的netcheck pod),如图所示:

  • Pod 状态是 Unknown,而不是常见的 CrashLoopBackOffImagePullBackOff

  • Unknown 状态的定义是:API Server 无法从 kubelet 获取该 Pod 的最新状态 。这不是 Pod 内部逻辑的问题,而是 节点和控制平面之间的通信问题

所以逻辑是这样的:

  • 如果 Pod 状态是 CrashLoopBackOff → 排查 Pod 配置(镜像、启动命令)。

  • 如果 Pod 状态是 ImagePullBackOff → 排查镜像仓库和拉取策略。

  • 如果 Pod 状态是 Unknown → 排查 节点/kubelet/containerd,因为控制平面根本拿不到 Pod 的状态。

  1. 确认 Pod 所在节点状态

    kubectl get pod netcheck -n default -o wide

执行后:

根据Node名称检查节点状态

复制代码
kubectl get nodes
kubectl describe node 192.168.152.135
  1. 检查 containerd 服务状态

    systemctl status containerd
    journalctl -u containerd -f

相关推荐
薪火铺子20 小时前
微服务认证方案对比与选型
微服务·云原生·架构
运维全栈笔记1 天前
K8S部署Redis高可用全攻略:1主2从3哨兵架构实战
redis·docker·云原生·容器·架构·kubernetes·bootstrap
尘世壹俗人1 天前
使用K8s部署模型
kubernetes
AI攻城狮1 天前
AI Agent 从上线到删库跑路始末
云原生
AI木马人1 天前
9.人工智能实战:GPU 服务如何上 Kubernetes?从单机部署到 K8s + NVIDIA Device Plugin + HPA 的生产级改造
人工智能·容器·kubernetes
码点滴1 天前
告别显存焦虑:PagedAttention 如何将大模型吞吐量提升 4 倍?
人工智能·架构·kubernetes·大模型·pagedattention
键盘鼓手苏苏1 天前
Kubernetes 容器安全最佳实践
云原生·kubernetes·k8
Elastic 中国社区官方博客1 天前
Elasticsearch Serverless 中跨项目搜索(CPS)的工作原理
大数据·elasticsearch·搜索引擎·云原生·serverless
键盘鼓手苏苏1 天前
Kubernetes 安全最佳实践
云原生·kubernetes·k8
小妖同学学AI1 天前
云原生AI服务新范式:Jina Serve框架,让多模态大模型落地像搭积木一样简单
人工智能·云原生·jina