K8S故障排查

故障现象:部署pod时,报错没发调度到节点。

排查步骤:

1、查看集群的状态

bash 复制代码
[root@k8s-master1 nginx]#kubectl get nodes

2、查看k8s组件的状态-kubelet,kube-apiservice

3、查看docker的Cgroup driver和k8s的Cgroup driver类型,发现docker是cgroup,k8s是systemd,问题点找到了。

bash 复制代码
[root@k8s-master1 nginx]#cat /etc/docker/daemon.json
{
"exec-opts": ["native.cgroupdriver=systemd"]
}

#重启docker服务和kubelet服务
[root@k8s-master1 nginx]#systemctl restart docker.service
[root@k8s-master1 nginx]#systemctl restart kubelet.service
相关推荐
AI攻城狮13 小时前
OpenFang 给我的一个提醒:AI Agent 真正难的不是自主,而是治理
人工智能·云原生·aigc
Java陈序员16 小时前
轻量强大!一款现代化的 Kubernetes 集群管理与监控工具!
云原生·容器·kubernetes
Johny_Zhao2 天前
OpenClaw中级到高级教程
linux·人工智能·信息安全·kubernetes·云计算·yum源·系统运维·openclaw
AI攻城狮3 天前
OpenClaw 里 TAVILY_API_KEY 明明写在 ~/.bashrc,为什么还是失效?一次完整排查与修复
人工智能·云原生·aigc
Sheffield3 天前
Alpine是什么,为什么是Docker首选?
linux·docker·容器
阿里云云原生3 天前
零配置部署顶级模型!函数计算一键解锁 Qwen3.5
云原生
AI攻城狮3 天前
Kimi Bot + OpenClaw 完整配置指南:5 步实现本地 AI Agent 集成
人工智能·云原生·aigc
AI攻城狮4 天前
RAG Chunking 为什么这么难?5 大挑战 + 最佳实践指南
人工智能·云原生·aigc
可观测性用观测云5 天前
云原生网关 Ingress-Nginx 链路追踪实战:OpenTelemetry 采集与观测云集成方案
nginx·kubernetes
哈里谢顿6 天前
Kubernetes Operator核心概念、实现原理和实战开发
云原生