k8s集群master节点的删除和重新加入

一、剔除master1节点

1)删除master1节点

3台master下掉一个,剩下2个master运行基本也没问题。坚持个一两天问题不大。

bash 复制代码
kubectl drain paas-m-k8s-master-1 --delete-local-data --force --ignore-daemonsets
kubectl delete node paas-m-k8s-master-1

2)清理etcd数据

a.进入etcd容器

bash 复制代码
kubectl -n kube-system exec -it etcd-paas-m-k8s-master-2 -- /bin/sh

b.查看member list

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member list

c.剔除已删除的master1

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member remove 7eab7c23b19f6778

二、master1重新加入

1)重置下master1

bash 复制代码
kubeadm reset

2)配置一个对域名apiserver.cluster.local的解析

修改 /etc/hosts

bash 复制代码
正常的master的ip apiserver.cluster.local

3)在master2上生成join命令

bash 复制代码
kubeadm init phase upload-certs --upload-certs
kubeadm token create --print-join-command

4)master1加入集群

bash 复制代码
kubeadm join apiserver.cluster.local:6443 \
--token yubedv.0rg185no5jgqwn07 \
--discovery-token-ca-cert-hash sha256:be87c7200420224f1f8d439a5f058de7be88282eec1fc833b346b38c62ddf482 \
--control-plane --certificate-key 23d8e27402b4f982d9ec894c37b1a3271c9f27bef2e653ca471426cc57025324

三、问题修复

1)域名解析不到apiserver.cluster.local

解决:

直接在/ets/hosts里配上

bash 复制代码
正常的master的ip apiserver.cluster.local

2)kubelet的端口占用

解决:

kubeadm join时会启动kubelet

bash 复制代码
使用kubeadm reset 重置配置

3)etcd目录不为空

解决:

删除即可。

bash 复制代码
rm -rf /var/lib/etcd

4)etcd健康检查失败

查看:

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member list

解决:

删除即可

bash 复制代码
etcdctl --endpoints=127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=etc/kubernetes/pki/etcd/peer.crt --key=/etc/kubernetes/pki/etcd/peer.key member remove 7eab7c23b19f6778
相关推荐
坚持的小马27 分钟前
k8s中执行脚本如果提示etcd找不到,可以做如下的操作
容器·kubernetes·etcd
easy_coder30 分钟前
从HDFS NN报错看Flink+K8s+HDFS:基础、架构与问题关联
hdfs·flink·kubernetes
回忆是昨天里的海2 小时前
k8s-部署springboot容器化应用
java·容器·kubernetes
立早正文2 小时前
Docker从零到一部署DNMP+Redis《全程干货》
docker·容器·php
hkNaruto2 小时前
【k8s】Kubernetes 资源限制设置规范手册 MB与MiB的概念混淆问题
云原生·容器·kubernetes
Mr. Cao code3 小时前
实战:Docker构建Haproxy负载均衡镜像
linux·运维·ubuntu·docker·容器·负载均衡
Xander W4 小时前
基于K8s集群的PyTorch DDP 框架分布式训练测试(开发机版)
人工智能·pytorch·分布式·python·深度学习·kubernetes
pp-周子晗(努力赶上课程进度版)5 小时前
Docker、Kubernetes与AWS中控机是什么?
docker·容器·kubernetes·aws
曾经的三心草8 小时前
最新版本组件的docker下载-Seata
运维·docker·容器
不爱笑的良田10 小时前
从零开始的云原生之旅(十一):压测实战:验证弹性伸缩效果
云原生·容器·kubernetes·go·压力测试·k6