ETCD备份还原

环境准备:

master 192.168.8.128

node1 192.168.8.129

k8s版本:

一:安装etcdctl工具

1.1下载安装包:

wget https://github.com/etcd-io/etcd/releases/download/v3.4.13/etcd-v3.4.13-linux-amd64.tar.gz

1.2解压:

tar xf etcd-v3.4.13-linux-amd64.tar.gz

1.3移动到sbin下:

mv etcd-v3.4.13-linux-amd64/etcdctl /usr/local/sbin/

1.4查看版本:

etcdctl version

二:开始备份

2.1首先查看所需要的认证文件:

kubectl describe pod etcd-k8smaster -n kube-system #查看etcd pod的详细信息

2.2备份命令:

ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key snapshot save /etcd-backup/etcddata_$(date +%F-%T).db

/etcd-backup/etcddata_$(date +%F-%T).db #指向备份到哪里以及定义名字

--cacert= 后面的文件就是上面截图中--trusted-ca-file=后面的文件

--cert=后面的文件就是上面截图中--cert-file=后面的文件

#--key=后面的文件就是上面截图中--key-file=后面的文件

  • /etc/kubernetes/pki/ca.crt:CA 证书,用于验证 etcd 服务器的身份。
  • /etc/kubernetes/pki/etcd/server.crt:etcd 服务器的客户端证书。
  • /etc/kubernetes/pki/etcd/server.key:etcd 服务器的私钥。

可以看到已经备份成功。

三:恢复

3.1恢复之前先查看一下现有的pod:

kubectl get pod

删除这三个pod,模拟意外丢失

kubectl delete deploy test #这三个pod是由deployment控制器创建的所以直接删除test控制器

已经删除。

3.2开始恢复

恢复之前要停止apiserver controller-manager scheduler etcd这些组件

原因:可以防止在恢复操作期间对 etcd 进行的任何写入操作,从而确保恢复过程的准确性和完整性。

由于etcd是通过静态Pod方式部署的,你可以通过重命名/etc/kubernetes/manifests/目录来停止所有由该目录下的YAML文件启动的服务

mv /etc/kubernetes/manifests/* /opt/backup/ #移动到其他目录

这时显示无法和apiserver建立连接了说明已经停止了。

将etcd的数据目录改名备份一下:

root@k8smaster1 etcd-backup\]# mv /var/lib/etcd /var/lib/etcd-bakcup 原因: 一会恢复的话会指定恢复的目录,以防止会冲突 #### 现在我们就可以进行恢复了 ETCDCTL_API=3 etcdctl snapshot restore /etcd-backup/etcddata_2024-12-19-16\\:43\\:45.db --name etcd-master01 --data-dir /var/lib/etcd --initial-cluster etcd-master01=https://192.168.8.128:2380 --initial-cluster-token etcd-cluster-token --initial-advertise-peer-urls https://192.168.8.128:2380 * `/etcd-backup/etcddata_2024-12-19-16:43:45.db`:这是备份文件的路径。 * `--name etcd-master01`:指定 etcd 实例的名称。 * `--data-dir /var/lib/etcd`:指定 etcd 数据存储的目录,就是我们上面改名的目录。 * `--initial-cluster etcd-master01=https://192.168.8.128:2380`:设置 etcd 的初始集群集信息,包括 etcd 服务器的地址。 * `--initial-cluster-token etcd-cluster-token`:指定用于加入集群集的令牌(token)。这个令牌用于验证加入集群的 etcd Pod。 * `--initial-advertise-peer-urls https://192.168.8.128:2380`:设置 etcd Pod 作为集群集成员时,其他 etcd Pod 如何发现并与之通信的初始对等 URL。 执行完之后需要将之前转移走的yaml文件转移回之前的目录: mv /opt/backup/\* /etc/kubernetes/manifests/ 查看pod kubectl get pod ![](https://i-blog.csdnimg.cn/direct/cc4958440b5645a590fe65adc0b76ca9.png) 可以看到已经恢复成功了,原先我们删除的pod也回来了

相关推荐
yoyo_zzm37 分钟前
MySQL数据库误删恢复_mysql 数据 误删
数据库·mysql·adb
F1FJJ1 小时前
Shield CLI 的 PostgreSQL 插件 v0.5.0 发布:数据库导出 + 协作增强,ER 图全新体验
网络·数据库·docker·postgresql·go
weixin199701080161 小时前
《深入浅出:图解淘宝分布式数据库TDDL(及开源替代方案)》
数据库·分布式·开源
数据库小组1 小时前
Oracle 上云 / 替代场景下,NineData 完成到 PostgreSQL 的低风险迁移
大数据·数据库·mysql·postgresql·oracle·数据一致性·数据库迁移
Ricky_Theseus2 小时前
SQL Server 2008 四种排序函数
数据库
柚子+2 小时前
Appium+python+雷电模拟器自动化测试入门
数据库·python·appium
云边有个稻草人2 小时前
SQL调优实战手册:索引、并行、参数调优一站式解决方案
数据库
数安3000天2 小时前
数据脱敏产品需要关注哪些因素?
数据库
杰克尼2 小时前
知识点总结--day05( 数据库)
数据库
代码派2 小时前
SQL 审核解决了部分问题,另一部分是慢 SQL 治理
数据库·sql·mysql·数据库管理工具·ninedata·sql审核·sql治理