环境准备：

master 192.168.8.128

node1 192.168.8.129

k8s版本：

一：安装etcdctl工具

1.1下载安装包：

wget https://github.com/etcd-io/etcd/releases/download/v3.4.13/etcd-v3.4.13-linux-amd64.tar.gz

1.2解压：

tar xf etcd-v3.4.13-linux-amd64.tar.gz

1.3移动到sbin下：

mv etcd-v3.4.13-linux-amd64/etcdctl /usr/local/sbin/

1.4查看版本：

etcdctl version

二：开始备份

2.1首先查看所需要的认证文件:

kubectl describe pod etcd-k8smaster -n kube-system #查看etcd pod的详细信息

2.2备份命令：

ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key snapshot save /etcd-backup/etcddata_$(date +%F-%T).db

/etcd-backup/etcddata_$(date +%F-%T).db #指向备份到哪里以及定义名字

--cacert= 后面的文件就是上面截图中--trusted-ca-file=后面的文件

--cert=后面的文件就是上面截图中--cert-file=后面的文件

#--key=后面的文件就是上面截图中--key-file=后面的文件

/etc/kubernetes/pki/ca.crt：CA 证书，用于验证 etcd 服务器的身份。
/etc/kubernetes/pki/etcd/server.crt：etcd 服务器的客户端证书。
/etc/kubernetes/pki/etcd/server.key：etcd 服务器的私钥。

可以看到已经备份成功。

三：恢复

3.1恢复之前先查看一下现有的pod:

kubectl get pod

删除这三个pod，模拟意外丢失

kubectl delete deploy test #这三个pod是由deployment控制器创建的所以直接删除test控制器

已经删除。

3.2开始恢复

恢复之前要停止apiserver controller-manager scheduler etcd这些组件

原因：可以防止在恢复操作期间对 etcd 进行的任何写入操作，从而确保恢复过程的准确性和完整性。

由于etcd是通过静态Pod方式部署的，你可以通过重命名/etc/kubernetes/manifests/目录来停止所有由该目录下的YAML文件启动的服务

mv /etc/kubernetes/manifests/* /opt/backup/ #移动到其他目录

这时显示无法和apiserver建立连接了说明已经停止了。

将etcd的数据目录改名备份一下：

$root@k8smaster1 etcd-backup$ # mv /var/lib/etcd /var/lib/etcd-bakcup

原因：一会恢复的话会指定恢复的目录，以防止会冲突

现在我们就可以进行恢复了

ETCDCTL_API=3 etcdctl snapshot restore /etcd-backup/etcddata_2024-12-19-16\:43\:45.db --name etcd-master01 --data-dir /var/lib/etcd --initial-cluster etcd-master01=https://192.168.8.128:2380 --initial-cluster-token etcd-cluster-token --initial-advertise-peer-urls https://192.168.8.128:2380

/etcd-backup/etcddata_2024-12-19-16:43:45.db：这是备份文件的路径。
--name etcd-master01：指定 etcd 实例的名称。
--data-dir /var/lib/etcd：指定 etcd 数据存储的目录，就是我们上面改名的目录。
--initial-cluster etcd-master01=https://192.168.8.128:2380：设置 etcd 的初始集群集信息，包括 etcd 服务器的地址。
--initial-cluster-token etcd-cluster-token：指定用于加入集群集的令牌（token）。这个令牌用于验证加入集群的 etcd Pod。
--initial-advertise-peer-urls https://192.168.8.128:2380：设置 etcd Pod 作为集群集成员时，其他 etcd Pod 如何发现并与之通信的初始对等 URL。

执行完之后需要将之前转移走的yaml文件转移回之前的目录：

mv /opt/backup/* /etc/kubernetes/manifests/

查看pod