k8s集群master节点的删除和重新加入

一、剔除master1节点

1)删除master1节点

3台master下掉一个,剩下2个master运行基本也没问题。坚持个一两天问题不大。

bash 复制代码
kubectl drain paas-m-k8s-master-1 --delete-local-data --force --ignore-daemonsets
kubectl delete node paas-m-k8s-master-1

2)清理etcd数据

a.进入etcd容器

bash 复制代码
kubectl -n kube-system exec -it etcd-paas-m-k8s-master-2 -- /bin/sh

b.查看member list

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member list

c.剔除已删除的master1

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member remove 7eab7c23b19f6778

二、master1重新加入

1)重置下master1

bash 复制代码
kubeadm reset

2)配置一个对域名apiserver.cluster.local的解析

修改 /etc/hosts

bash 复制代码
正常的master的ip apiserver.cluster.local

3)在master2上生成join命令

bash 复制代码
kubeadm init phase upload-certs --upload-certs
kubeadm token create --print-join-command

4)master1加入集群

bash 复制代码
kubeadm join apiserver.cluster.local:6443 \
--token yubedv.0rg185no5jgqwn07 \
--discovery-token-ca-cert-hash sha256:be87c7200420224f1f8d439a5f058de7be88282eec1fc833b346b38c62ddf482 \
--control-plane --certificate-key 23d8e27402b4f982d9ec894c37b1a3271c9f27bef2e653ca471426cc57025324

三、问题修复

1)域名解析不到apiserver.cluster.local

解决:

直接在/ets/hosts里配上

bash 复制代码
正常的master的ip apiserver.cluster.local

2)kubelet的端口占用

解决:

kubeadm join时会启动kubelet

bash 复制代码
使用kubeadm reset 重置配置

3)etcd目录不为空

解决:

删除即可。

bash 复制代码
rm -rf /var/lib/etcd

4)etcd健康检查失败

查看:

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member list

解决:

删除即可

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member remove 7eab7c23b19f6778
相关推荐
风落无尘3 小时前
Stable Diffusion WebUI & ComfyUI 完整安装教程:官方部署+一键整合包+Docker容器化(2026最新)
docker·容器·stable diffusion
CodeMartain8 小时前
Dify Windows 原生部署(无 Docker、纯本地)
运维·docker·容器
牛奶咖啡139 小时前
k8s容器编排技术实践——使用containerd作为容器运行时部署k8s集群
kubernetes·k8s的安装部署·开启系统的ipvs支持·安装containerd·containerd配置加速器·安装k8s的工具·安装calico网络插件
万里侯9 小时前
云原生数据备份与恢复:保障数据安全的最佳实践
微服务·容器·k8s
llrraa201010 小时前
配置docker国内镜像源
运维·docker·容器
阿里云云原生10 小时前
阿里云 STAROps 全域智能运维平台发布!从“被动救火”到“主动自治”
云原生
2301_7807896611 小时前
手游遇到攻击为什么要用SDK游戏盾手游遇到攻击为什么要用 SDK 游戏盾?
安全·web安全·游戏·架构·kubernetes·ddos
35岁程序员的自救之路11 小时前
AiBBS - 面向下一个十年的AI + 云原生社区系统
人工智能·云原生
珂玥c12 小时前
k8s集群ingress碎碎念
云原生·容器·kubernetes
佳杰云星12 小时前
如何给大模型集群选“大脑”?智算调度与管理平台 10 维选型指南(附选型评分表)
人工智能·kubernetes·大模型·云计算·gpu·算力调度·智算中心