k8s etcd 数据损坏处理方式

服务器非正常关机(意外掉电、强制拔电)后 ,etcd 数据损坏

无备份情况

复制代码
master 报错:
kubectl get nodes
6443连接失败

排查:
查询:docker
docker logs (kube-apiserver)日志
报错如下:
SubChannel #4] grpc: addrConn.createTransport failed to connect to {Addr: "127.0.0.1:2379", ServerName: "127.0.
0.1:2379", }. Err: connection error: desc = "transport: Error while dialing: dial tcp 127.0.0.1:2379: connect: connection refused"

处理:
#1.不知道路径可以查找etcd数据目录
find / -type d -name member
cd /var/lib/etcd/member
mv * /root/member.back
# 注:在故障节点执行,删除或者移走备份都可以

#1.重启etcd
docker ps -a|grep etcd
docker rm -f etcd的ID        # 所有节点执行
systemctl restart kubelet    # 重启kubelet
 
#2.查看
kubectl get pods
# 注:此时没有报错了


# 然后重新初始化集群。(缺点就是什么数据都没了)
kubeadm init \
--apiserver-advertise-address=192.168.174.136 \
--image-repository=registry.aliyuncs.com/google_containers \
--kubernetes-version=v1.29.2 \
--service-cidr=10.10.0.0/12  \
--pod-network-cidr=10.244.0.0/16 \
--ignore-preflight-errors=all \
--cri-socket=unix:///var/run/cri-dockerd.sock

etcd版本查询

bash 复制代码
docker ps -a | grep etcd
829dbbfb08cf   a0eed15eed44   "etcd --advertise-cl..."   About an hour ago   Up About an hour                                                                                                 k8s_etcd_etcd-k8s-master_kube-system_ec1fb561c6d9370f8f5b368e02c0c08d_283
6ce9f09a3996   registry.aliyuncs.com/google_containers/pause:3.9   "/pause"    About an hour ago   Up About an hour                                                                         k8s_POD_etcd-k8s-master_kube-system_ec1fb561c6d9370f8f5b368e02c0c08d_7

docker exec -it 829dbbfb08cf sh
sh-5.2# etcdctl version
etcdctl version: 3.5.10
API version: 3.5
相关推荐
张忠琳28 分钟前
【client-go v0.36.1】(store Part 2)Store 超深度分析 — threadSafeMap 核心、索引体系、RV追踪、事务机制
云原生·kubernetes·informer·store·client-go
sbjdhjd1 小时前
04(上)| k8s中的微服务
微服务·云原生·kubernetes·开源·云计算·excel·kubelet
梦想的颜色3 小时前
硬核|Docker从入门到精通:镜像构建、仓库推送、Compose编排、生产部署全攻略
运维·服务器·docker·容器·部署·环境·镜像
SXJR4 小时前
使用docker 部署向量数据库Milvus
数据库·docker·容器·milvus·向量数据库
qq_452396234 小时前
第二篇:《K8s 集群搭建:Minikube、kubeadm、Kind 对比与实操》
容器·kubernetes·kind
jingqiulyue5 小时前
docker run出现exited或者不断restart怎么办
docker·容器
小哈里5 小时前
【K8S】OCI标准下的企业级镜像治理:Harbor+Skopeo+Trivy 最佳实践
云原生·容器·kubernetes·harbor·镜像·skopen
花间相见5 小时前
【Kubernetes02】—— 使用 kubeadm 从零搭建 K8s 集群(实操避坑版)
云原生·容器·kubernetes
人工智能培训5 小时前
从GPT到开源大模型
人工智能·gpt·深度学习·机器学习·容器·知识图谱
张小凡vip6 小时前
Kubernetes--secret的简介和使用
云原生·容器·kubernetes