K8S认证|CKA题库+答案| 14. 排查故障节点

14、排查集群中的故障节点

您必须在以下Cluster/Node上完成此考题:

Cluster Master node Worker node

wk8s master node01

设置配置环境:

candidate@node01\]$ kubectl config use-context wk8s **Context** 集群节点状态修复 **Task** 名为 node02 的 Kubernetes worker node 处于 NotReady 状态。调查发生这种情况的原因,并 采取相应的措施将 node 恢复为 Ready 状态,确 保所做的任何更改永久生效。可以使用以下命令, 通过 ssh 连接到 node02 节点: ssh node02 可以使用以下命令,在该节点上获取更高权限: sudo -i

开始操作:

bash 复制代码
# 考试时有多套集群环境,以免答题环境相互干扰。
# 所以考试时务必按照题目要求先切换到所对应的集群环境,才是正确答题的前提,非常重要
# 请务必确认现在所处节点为node01,否则无法切换集群而报错
kubectl config use-context wk8s

#查看节点状态
kubectl get nodes

CKA模拟环境操作截图,node02确实为NotReady状态:

登录故障节点,检查故障原因

bash 复制代码
#登录故障节点
ssh node02
#进行提权
sudo -i
#查看kubelet工作状态
systemctl status kubelet

CKA模拟环境操作截图,kubelet为dead状态:

修复kubelet进程状态

bash 复制代码
#启动并设置开机启动
systemctl enable kubelet --now
#查看kubelet工作状态
systemctl status kubelet

CKA模拟环境操作截图,kubelet为running状态,已经成功修复:

然后退回到node01节点,再次检查节点状态

bash 复制代码
#退出提权状态
exit
#退出node02登录
exit
#在node01执行如下命令,查看各节点状态
kubectl get nodes	

CKA模拟环境操作截图,node02状态为Ready,已经成功修复:


CKA仿真模拟环境简短视频演示:

相关推荐
可观测性用观测云1 小时前
云原生网关 Ingress-Nginx 链路追踪实战:OpenTelemetry 采集与观测云集成方案
nginx·kubernetes
甲鱼9295 小时前
MySQL 实战手记:日志管理与主从复制搭建全指南
运维
Johny_Zhao19 小时前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
哈里谢顿20 小时前
Kubernetes Operator核心概念、实现原理和实战开发
云原生
阿里云云原生1 天前
你的 OpenClaw 真的在受控运行吗?
云原生
阿里云云原生1 天前
5 分钟零代码改造,让 Go 应用自动获得全链路可观测能力
云原生·go
Shanyoufusu121 天前
RKE2 单节点集群安装 Rancher+ 私有镜像仓库搭建 完整教程
云原生
阿里云云原生1 天前
Dify 官方上架 Higress 插件,轻松接入 AI 网关访问模型服务
云原生
AI攻城狮1 天前
OpenClaw Session 管理完全指南:Context 压缩、重置与持久化
人工智能·云原生·aigc
蝎子莱莱爱打怪2 天前
GitLab CI/CD + Docker Registry + K8s 部署完整实战指南
后端·docker·kubernetes