cka-2026-etcd

kubeadm配置的集群已迁移到新机器。它需要更改配置才能成功运行。

Task

修复在机器迁移过程中损坏的单节点集群。

首先,确定损坏的集群组件,并调查导致其损坏的原因。注意:已停用的集群使用外部 etcd 服务器。

接下来,修复所有损坏的集群组件的配置。

注意:确保重新启动所有必要的服务和组件,以使更改生效。否则可能导致分数降低。

最后,确保集群运行正常。确保:

每个节点 和 所有 Pod 都处于 Ready 状态。

步骤1.修复 etcd

编辑 kube-apiserver 的静态 Pod 清单文件,修正 --etcd-servers 参数。

vim /etc/kubernetes/manifests/kube-apiserver.yaml

找到 --etcd-servers 参数,确保其指向本地 etcd 服务器地址

--etcd-servers=https://127.0.0.1:2379

步骤2.修改完成后,必须要重启一下kubelet 服务

systemctl daemon-reload

systemctl restart kubelet

此时虽然 node Ready 了,但是kube-scheduler-master01 还是有异常的,需要继续操作。

kubectl get nodes

kubectl -n kube-system get pod

步骤3. 修复 kube-scheduler-master01

vim /etc/kubernetes/manifests/kube-scheduler.yaml

将改 requests cpu 成 100m(其实只要低于这个 node 的 request cpu 的剩余量,都是可以的,跟 resources cpu 和 memory 类似)

cpu: 100m

步骤4.验证集群状态

kubectl get nodes

kubectl -n kube-system get pod

相关推荐
fan65404145 小时前
GEO服务商技术评估的四维量化框架:以杭州文澜天下科技为例
运维·人工智能·科技
Lalolander5 小时前
设备工程项目如何高效管理项目进度与成本?
大数据·运维·设备工程项目管理·设备工程项目成本管理·工程项目进度管理
土星云SaturnCloud5 小时前
土星云边缘计算设备的多模态模型部署实操
服务器·人工智能·ai·边缘计算
s_w.h5 小时前
【 linux 】理解进程状态
linux·运维·服务器
zandy10115 小时前
2026嵌入式BI PaaS平台技术剖析与实现指南
java·运维·paas
JAVA学习通6 小时前
《大营销平台系统设计实现》 - 营销服务 第9节:模板模式串联抽奖规则
服务器·前端·javascript
流年随风6 小时前
在LINUX服务器 CentOS 7中同步网络时间
linux·服务器·centos
Harm灬小海6 小时前
【云计算学习之路】学习Centos7系统:服务搭建(VSFTP)
linux·运维·服务器·学习·云计算
志栋智能6 小时前
超自动化安全:如何降低人为操作失误风险?
运维·安全·自动化
vortex56 小时前
virsh 使用指南:KVM 虚拟化管理的命令行艺术
linux·运维·服务器