【ETCD】【实操篇(十四)】etcd 集群备份与还原指南

etcd 是一个高可用的分布式键值存储,常用于分布式系统的配置共享和服务注册。本文将基于提供的启动脚本,详细讲解如何对 etcd 集群进行数据的备份与还原。

目录

    • [一、启动 etcd 集群](#一、启动 etcd 集群)
    • [二、备份 etcd 数据](#二、备份 etcd 数据)
      • [1. 使用 etcdctl 保存快照](#1. 使用 etcdctl 保存快照)
      • [2. 验证快照文件](#2. 验证快照文件)
    • [三、还原 etcd 数据](#三、还原 etcd 数据)
      • [1. 使用 etcdutl 恢复快照](#1. 使用 etcdutl 恢复快照)
      • [2. 使用新数据目录启动集群](#2. 使用新数据目录启动集群)
      • [3. 验证恢复后的集群](#3. 验证恢复后的集群)
    • 四、注意事项
    • 五、总结

一、启动 etcd 集群

以下是用于启动一个三节点 etcd 集群的脚本:

@echo off
REM 设置通用参数
set TOKEN=token-01
set CLUSTER_STATE=new
set NAME_1=machine-1
set NAME_2=machine-2
set NAME_3=machine-3
set HOST_1=127.0.0.1
set HOST_2=127.0.0.1
set HOST_3=127.0.0.1
set PEER_PORT_1=2380
set PEER_PORT_2=2381
set PEER_PORT_3=2382
set CLIENT_PORT_1=2379
set CLIENT_PORT_2=2383
set CLIENT_PORT_3=2384
set CLUSTER=%NAME_1%=http://%HOST_1%:%PEER_PORT_1%,%NAME_2%=http://%HOST_2%:%PEER_PORT_2%,%NAME_3%=http://%HOST_3%:%PEER_PORT_3%

REM 创建目录存储 etcd 数据
mkdir data.etcd1
mkdir data.etcd2
mkdir data.etcd3

REM 启动第一个 etcd 实例
start etcd.exe --data-dir=data.etcd1 --name %NAME_1% ^
    --initial-advertise-peer-urls http://%HOST_1%:%PEER_PORT_1% --listen-peer-urls http://%HOST_1%:%PEER_PORT_1% ^
    --advertise-client-urls http://%HOST_1%:%CLIENT_PORT_1% --listen-client-urls http://%HOST_1%:%CLIENT_PORT_1% ^
    --initial-cluster %CLUSTER% ^
    --initial-cluster-state %CLUSTER_STATE% --initial-cluster-token %TOKEN% ^
    --log-level debug

REM 启动第二个 etcd 实例
start etcd.exe --data-dir=data.etcd2 --name %NAME_2% ^
    --initial-advertise-peer-urls http://%HOST_2%:%PEER_PORT_2% --listen-peer-urls http://%HOST_2%:%PEER_PORT_2% ^
    --advertise-client-urls http://%HOST_2%:%CLIENT_PORT_2% --listen-client-urls http://%HOST_2%:%CLIENT_PORT_2% ^
    --initial-cluster %CLUSTER% ^
    --initial-cluster-state %CLUSTER_STATE% --initial-cluster-token %TOKEN% ^
    --log-level debug

REM 启动第三个 etcd 实例
start etcd.exe --data-dir=data.etcd3 --name %NAME_3% ^
    --initial-advertise-peer-urls http://%HOST_3%:%PEER_PORT_3% --listen-peer-urls http://%HOST_3%:%PEER_PORT_3% ^
    --advertise-client-urls http://%HOST_3%:%CLIENT_PORT_3% --listen-client-urls http://%HOST_3%:%CLIENT_PORT_3% ^
    --initial-cluster %CLUSTER% ^
    --initial-cluster-state %CLUSTER_STATE% --initial-cluster-token %TOKEN% ^
    --log-level debug

echo All etcd instances started with debug logging. Press any key to exit...
pause

执行此脚本后,etcd 集群的三个节点将在本地启动,分别监听不同的客户端和对等通信端口。

二、备份 etcd 数据

备份是保障数据安全的重要步骤。以下是备份 etcd 集群数据的操作步骤:

1. 使用 etcdctl 保存快照

确保 etcdctl 已正确配置,执行以下命令保存当前集群数据的快照:

etcdctl snapshot save snapshot.db

成功执行后,将生成一个名为 snapshot.db 的快照文件。

2. 验证快照文件

为了确保快照文件的完整性,可以通过以下命令验证:

etcdctl snapshot status snapshot.db

该命令将输出快照的元数据,如版本信息、数据大小等。

三、还原 etcd 数据

还原是将快照文件中的数据恢复到新的 etcd 集群中。以下是具体步骤:

1. 使用 etcdutl 恢复快照

使用 etcdctl 工具将快照文件还原到新的数据目录:

etcdctl snapshot restore db   --name m1 
  --initial-cluster m1=http://127.0.0.1:2380,m2=http://127.0.0.1:2381,m3=http://127.0.0.1:2382  --initial-cluster-token etcd-cluster-1  --initial-advertise-peer-urls http://127.0.0.1:2380

etcdctl snapshot restore db --name m2 --initial-cluster m1=http://127.0.0.1:2380,m2=http://127.0.0.1:2381,m3=http://127.0.0.1:2382 --initial-cluster-token etcd-cluster-1 --initial-advertise-peer-urls http://127.0.0.1:2381

etcdutl snapshot restore db --name m3 --initial-cluster m1=http://127.0.0.1:2380,m2=http://127.0.0.1:2381,m3=http://127.0.0.1:2382 --initial-cluster-token etcd-cluster-1 --initial-advertise-peer-urls http://127.0.0.1:2382

每个命令都会为对应节点创建一个新的数据目录,例如 m1.etcdm2.etcdm3.etcd

2. 使用新数据目录启动集群

使用还原后的数据目录重新启动 etcd 集群:

etcd --name m1 \
  --data-dir m1.etcd
  --listen-client-urls http://127.0.0.1:2379 \
  --advertise-client-urls http://127.0.0.1:2379 \
  --listen-peer-urls http://127.0.0.1:2380 &

etcd --name m2 \
  --data-dir m2.etcd \
  --listen-client-urls http://127.0.0.1:2383 \
  --advertise-client-urls http://127.0.0.1:2383 \
  --listen-peer-urls http://127.0.0.1:2381 &

etcd --name m3 \
  --data-dir m3.etcd
  --listen-client-urls http://127.0.0.1:2384 \
  --advertise-client-urls http://127.0.0.1:2384 \
  --listen-peer-urls http://127.0.0.1:2382 &

3. 验证恢复后的集群

确保集群启动成功后,可以通过以下命令检查节点状态:

etcdctl endpoint status --cluster

输出应包含所有节点的健康状态和元数据,表明集群已成功恢复。

四、注意事项

  1. 备份频率:根据业务需要,定期执行快照备份,确保数据安全。
  2. 权限配置:备份与还原操作需具有相应权限,避免数据泄露。
  3. 版本兼容性:确保 etcdctl、etcdutl 与 etcd 集群的版本一致。
  4. 测试还原:在生产环境中使用前,建议在测试环境中验证备份与还原流程。

五、总结

本文基于启动脚本,详细讲解了 etcd 集群的备份与还原操作。通过备份,保障数据的持久性与安全性;通过还原,快速恢复数据并确保业务连续性。

相关推荐
时雨h5 分钟前
30天面试打卡计划 2024-12-25 26 27 面试题
java·开发语言·数据库
TDengine (老段)2 小时前
TDengine 新功能 VARBINARY 数据类型
大数据·c语言·数据库·时序数据库·tdengine·涛思数据
yuenblue4 小时前
什么是ondelete cascade以及使用sqlite演示ondelete cascade使用案例
数据库·sqlite
howard_shooter4 小时前
Oracle Managed Files(OMF)
数据库·oracle
yangfeipancc5 小时前
数据库-用户管理
android·数据库
两点王爷6 小时前
Java读取csv文件内容,保存到sqlite数据库中
java·数据库·sqlite·csv
凡人的AI工具箱7 小时前
每天40分玩转Django:Django部署概述
开发语言·数据库·后端·python·django
2401_871213308 小时前
mysql之MHA
数据库·mysql
言之。8 小时前
【MySQL】事务
数据库·mysql
潇湘秦8 小时前
Oracle 11G还有新BUG?ORACLE 表空间迷案!
数据库·oracle