cka-2026-etcd

kubeadm配置的集群已迁移到新机器。它需要更改配置才能成功运行。

Task

修复在机器迁移过程中损坏的单节点集群。

首先,确定损坏的集群组件,并调查导致其损坏的原因。注意:已停用的集群使用外部 etcd 服务器。

接下来,修复所有损坏的集群组件的配置。

注意:确保重新启动所有必要的服务和组件,以使更改生效。否则可能导致分数降低。

最后,确保集群运行正常。确保:

每个节点 和 所有 Pod 都处于 Ready 状态。

步骤1.修复 etcd

编辑 kube-apiserver 的静态 Pod 清单文件,修正 --etcd-servers 参数。

vim /etc/kubernetes/manifests/kube-apiserver.yaml

找到 --etcd-servers 参数,确保其指向本地 etcd 服务器地址

--etcd-servers=https://127.0.0.1:2379

步骤2.修改完成后,必须要重启一下kubelet 服务

systemctl daemon-reload

systemctl restart kubelet

此时虽然 node Ready 了,但是kube-scheduler-master01 还是有异常的,需要继续操作。

kubectl get nodes

kubectl -n kube-system get pod

步骤3. 修复 kube-scheduler-master01

vim /etc/kubernetes/manifests/kube-scheduler.yaml

将改 requests cpu 成 100m(其实只要低于这个 node 的 request cpu 的剩余量,都是可以的,跟 resources cpu 和 memory 类似)

cpu: 100m

步骤4.验证集群状态

kubectl get nodes

kubectl -n kube-system get pod

相关推荐
阿里云大数据AI技术12 小时前
阿里云 EMR AI 助手正式发布:从问答工具到全栈智能运维助手
运维·人工智能
你好潘先生18 小时前
别再记命令了,用 yeero do 说句人话就能跑脚本,而且不烧 token
服务器·python·命令行
SkyWalking中文站1 天前
认识 Horizon UI · 6/17:Trace 探索器
运维·监控·自动化运维
程序员老赵2 天前
服务器文件不想 SFTP 上传?Docker 跑个 File Browser,浏览器就能管理
服务器·docker·开源
火车叼位2 天前
写给初级开发者:SSL、SSH、HTTPS 与证书体系全解析
运维
vivo互联网技术2 天前
从 10 分钟到 1 秒:ES 深度分页任意跳页的三轮优化实战
服务器·数据库·redis·elasticsearch·深度分页
小猿姐2 天前
唯品会大规模数据库云原生实践:基于 KubeBlocks 管理数千实例的统一运维之路
运维·elasticsearch·云原生
SkyWalking中文站3 天前
认识 Horizon UI · 5/17:3D 基础设施地图
运维·监控·自动化运维
SkyWalking中文站3 天前
认识 Horizon UI · 1/17:SkyWalking 新一代可观测性控制台
运维·前端·监控