k8s etcd 数据损坏处理方式

服务器非正常关机(意外掉电、强制拔电)后 ,etcd 数据损坏

无备份情况

复制代码
master 报错:
kubectl get nodes
6443连接失败

排查:
查询:docker
docker logs (kube-apiserver)日志
报错如下:
SubChannel #4] grpc: addrConn.createTransport failed to connect to {Addr: "127.0.0.1:2379", ServerName: "127.0.
0.1:2379", }. Err: connection error: desc = "transport: Error while dialing: dial tcp 127.0.0.1:2379: connect: connection refused"

处理:
#1.不知道路径可以查找etcd数据目录
find / -type d -name member
cd /var/lib/etcd/member
mv * /root/member.back
# 注:在故障节点执行,删除或者移走备份都可以

#1.重启etcd
docker ps -a|grep etcd
docker rm -f etcd的ID        # 所有节点执行
systemctl restart kubelet    # 重启kubelet
 
#2.查看
kubectl get pods
# 注:此时没有报错了


# 然后重新初始化集群。(缺点就是什么数据都没了)
kubeadm init \
--apiserver-advertise-address=192.168.174.136 \
--image-repository=registry.aliyuncs.com/google_containers \
--kubernetes-version=v1.29.2 \
--service-cidr=10.10.0.0/12  \
--pod-network-cidr=10.244.0.0/16 \
--ignore-preflight-errors=all \
--cri-socket=unix:///var/run/cri-dockerd.sock

etcd版本查询

bash 复制代码
docker ps -a | grep etcd
829dbbfb08cf   a0eed15eed44   "etcd --advertise-cl..."   About an hour ago   Up About an hour                                                                                                 k8s_etcd_etcd-k8s-master_kube-system_ec1fb561c6d9370f8f5b368e02c0c08d_283
6ce9f09a3996   registry.aliyuncs.com/google_containers/pause:3.9   "/pause"    About an hour ago   Up About an hour                                                                         k8s_POD_etcd-k8s-master_kube-system_ec1fb561c6d9370f8f5b368e02c0c08d_7

docker exec -it 829dbbfb08cf sh
sh-5.2# etcdctl version
etcdctl version: 3.5.10
API version: 3.5
相关推荐
gs8014018 小时前
网络隐形杀手:从 Could not connect to SMTP host 报错深度剖析 Docker MTU 黑洞理论与实战
网络·docker·容器
程序猿阿伟19 小时前
《一套完整方法论:搞定图形应用的Docker镜像优化》
数据库·docker·容器
java_logo20 小时前
2026 Docker 国内镜像加速配置教程
运维·docker·容器·docker镜像·docker镜像源·docker镜像加速·docker镜像国内库
IT策士21 小时前
Docker从0到1再到 Kubernetes 实战:第15篇Compose 中的服务依赖、健康检查与启动顺序
docker·容器·kubernetes
Waay21 小时前
K8s Deployment 滚动更新与回滚深度详解(含踩坑实录+生产选型原理)
云原生·容器·kubernetes
顾默@21 小时前
双系统Ubuntu18.04升级22.04,安装docker进行openclaw安装
运维·docker·容器
蜀道山老天师1 天前
Docker Compose 多容器编排实战:LNMP、Tomcat 集群、云桌面、Portainer、Zabbix 一键部署
运维·docker·容器·tomcat·zabbix
见牛羊1 天前
docker理解
java·docker·容器
IT策士1 天前
Docker 从 0 到 1 再到 Kubernetes 实战:第18篇 从 Docker Compose 到 Kubernetes 的思考
docker·容器·kubernetes
linmengmeng_13141 天前
【总结】Docker 容器重建后 Nginx 502 问题排查与解决
nginx·docker·容器