cka-2026-etcd

kubeadm配置的集群已迁移到新机器。它需要更改配置才能成功运行。

Task

修复在机器迁移过程中损坏的单节点集群。

首先,确定损坏的集群组件,并调查导致其损坏的原因。注意:已停用的集群使用外部 etcd 服务器。

接下来,修复所有损坏的集群组件的配置。

注意:确保重新启动所有必要的服务和组件,以使更改生效。否则可能导致分数降低。

最后,确保集群运行正常。确保:

每个节点 和 所有 Pod 都处于 Ready 状态。

步骤1.修复 etcd

编辑 kube-apiserver 的静态 Pod 清单文件,修正 --etcd-servers 参数。

vim /etc/kubernetes/manifests/kube-apiserver.yaml

找到 --etcd-servers 参数,确保其指向本地 etcd 服务器地址

--etcd-servers=https://127.0.0.1:2379

步骤2.修改完成后,必须要重启一下kubelet 服务

systemctl daemon-reload

systemctl restart kubelet

此时虽然 node Ready 了,但是kube-scheduler-master01 还是有异常的,需要继续操作。

kubectl get nodes

kubectl -n kube-system get pod

步骤3. 修复 kube-scheduler-master01

vim /etc/kubernetes/manifests/kube-scheduler.yaml

将改 requests cpu 成 100m(其实只要低于这个 node 的 request cpu 的剩余量,都是可以的,跟 resources cpu 和 memory 类似)

cpu: 100m

步骤4.验证集群状态

kubectl get nodes

kubectl -n kube-system get pod

相关推荐
航Hang*2 小时前
VMware vSphere 云平台运维与管理基础——第5章:VMware vSphere 5.5 高级特性
运维·服务器·开发语言·windows·学习·虚拟化
Mapleay2 小时前
Ubuntu 源的重要性!之 libgmp-dev 无法安装
linux·服务器·windows
Benszen2 小时前
Linux容器:轻量级虚拟化革命
java·linux·运维
问简3 小时前
ubuntu 字体相关问题
运维·服务器·ubuntu
王燕龙(大卫)3 小时前
tcp报文什么时候会真正发送
服务器·网络·tcp/ip
勿忘,瞬间3 小时前
网络编程套接字
运维·服务器·网络
二等饼干~za8986683 小时前
源码可控:云罗 GEO 源头工厂,开源搭建 + 二次开发全链路解决方案
服务器·开发语言·开源·php·音视频·ai-native
zhanghongbin013 小时前
本地持久化:网络故障数据保护
服务器·网络·php
funnycoffee1233 小时前
华为USG防火墙的HRP逃逸是什么机制?
运维·服务器·网络·华为usg