【ETCD】【实操篇(十四)】etcd 集群备份与还原指南

etcd 是一个高可用的分布式键值存储,常用于分布式系统的配置共享和服务注册。本文将基于提供的启动脚本,详细讲解如何对 etcd 集群进行数据的备份与还原。

目录

    • [一、启动 etcd 集群](#一、启动 etcd 集群)
    • [二、备份 etcd 数据](#二、备份 etcd 数据)
      • [1. 使用 etcdctl 保存快照](#1. 使用 etcdctl 保存快照)
      • [2. 验证快照文件](#2. 验证快照文件)
    • [三、还原 etcd 数据](#三、还原 etcd 数据)
      • [1. 使用 etcdutl 恢复快照](#1. 使用 etcdutl 恢复快照)
      • [2. 使用新数据目录启动集群](#2. 使用新数据目录启动集群)
      • [3. 验证恢复后的集群](#3. 验证恢复后的集群)
    • 四、注意事项
    • 五、总结

一、启动 etcd 集群

以下是用于启动一个三节点 etcd 集群的脚本:

复制代码
@echo off
REM 设置通用参数
set TOKEN=token-01
set CLUSTER_STATE=new
set NAME_1=machine-1
set NAME_2=machine-2
set NAME_3=machine-3
set HOST_1=127.0.0.1
set HOST_2=127.0.0.1
set HOST_3=127.0.0.1
set PEER_PORT_1=2380
set PEER_PORT_2=2381
set PEER_PORT_3=2382
set CLIENT_PORT_1=2379
set CLIENT_PORT_2=2383
set CLIENT_PORT_3=2384
set CLUSTER=%NAME_1%=http://%HOST_1%:%PEER_PORT_1%,%NAME_2%=http://%HOST_2%:%PEER_PORT_2%,%NAME_3%=http://%HOST_3%:%PEER_PORT_3%

REM 创建目录存储 etcd 数据
mkdir data.etcd1
mkdir data.etcd2
mkdir data.etcd3

REM 启动第一个 etcd 实例
start etcd.exe --data-dir=data.etcd1 --name %NAME_1% ^
    --initial-advertise-peer-urls http://%HOST_1%:%PEER_PORT_1% --listen-peer-urls http://%HOST_1%:%PEER_PORT_1% ^
    --advertise-client-urls http://%HOST_1%:%CLIENT_PORT_1% --listen-client-urls http://%HOST_1%:%CLIENT_PORT_1% ^
    --initial-cluster %CLUSTER% ^
    --initial-cluster-state %CLUSTER_STATE% --initial-cluster-token %TOKEN% ^
    --log-level debug

REM 启动第二个 etcd 实例
start etcd.exe --data-dir=data.etcd2 --name %NAME_2% ^
    --initial-advertise-peer-urls http://%HOST_2%:%PEER_PORT_2% --listen-peer-urls http://%HOST_2%:%PEER_PORT_2% ^
    --advertise-client-urls http://%HOST_2%:%CLIENT_PORT_2% --listen-client-urls http://%HOST_2%:%CLIENT_PORT_2% ^
    --initial-cluster %CLUSTER% ^
    --initial-cluster-state %CLUSTER_STATE% --initial-cluster-token %TOKEN% ^
    --log-level debug

REM 启动第三个 etcd 实例
start etcd.exe --data-dir=data.etcd3 --name %NAME_3% ^
    --initial-advertise-peer-urls http://%HOST_3%:%PEER_PORT_3% --listen-peer-urls http://%HOST_3%:%PEER_PORT_3% ^
    --advertise-client-urls http://%HOST_3%:%CLIENT_PORT_3% --listen-client-urls http://%HOST_3%:%CLIENT_PORT_3% ^
    --initial-cluster %CLUSTER% ^
    --initial-cluster-state %CLUSTER_STATE% --initial-cluster-token %TOKEN% ^
    --log-level debug

echo All etcd instances started with debug logging. Press any key to exit...
pause

执行此脚本后,etcd 集群的三个节点将在本地启动,分别监听不同的客户端和对等通信端口。

二、备份 etcd 数据

备份是保障数据安全的重要步骤。以下是备份 etcd 集群数据的操作步骤:

1. 使用 etcdctl 保存快照

确保 etcdctl 已正确配置,执行以下命令保存当前集群数据的快照:

复制代码
etcdctl snapshot save snapshot.db

成功执行后,将生成一个名为 snapshot.db 的快照文件。

2. 验证快照文件

为了确保快照文件的完整性,可以通过以下命令验证:

复制代码
etcdctl snapshot status snapshot.db

该命令将输出快照的元数据,如版本信息、数据大小等。

三、还原 etcd 数据

还原是将快照文件中的数据恢复到新的 etcd 集群中。以下是具体步骤:

1. 使用 etcdutl 恢复快照

使用 etcdctl 工具将快照文件还原到新的数据目录:

复制代码
etcdctl snapshot restore db   --name m1 
  --initial-cluster m1=http://127.0.0.1:2380,m2=http://127.0.0.1:2381,m3=http://127.0.0.1:2382  --initial-cluster-token etcd-cluster-1  --initial-advertise-peer-urls http://127.0.0.1:2380

etcdctl snapshot restore db --name m2 --initial-cluster m1=http://127.0.0.1:2380,m2=http://127.0.0.1:2381,m3=http://127.0.0.1:2382 --initial-cluster-token etcd-cluster-1 --initial-advertise-peer-urls http://127.0.0.1:2381

etcdutl snapshot restore db --name m3 --initial-cluster m1=http://127.0.0.1:2380,m2=http://127.0.0.1:2381,m3=http://127.0.0.1:2382 --initial-cluster-token etcd-cluster-1 --initial-advertise-peer-urls http://127.0.0.1:2382

每个命令都会为对应节点创建一个新的数据目录,例如 m1.etcdm2.etcdm3.etcd

2. 使用新数据目录启动集群

使用还原后的数据目录重新启动 etcd 集群:

复制代码
etcd --name m1 \
  --data-dir m1.etcd
  --listen-client-urls http://127.0.0.1:2379 \
  --advertise-client-urls http://127.0.0.1:2379 \
  --listen-peer-urls http://127.0.0.1:2380 &

etcd --name m2 \
  --data-dir m2.etcd \
  --listen-client-urls http://127.0.0.1:2383 \
  --advertise-client-urls http://127.0.0.1:2383 \
  --listen-peer-urls http://127.0.0.1:2381 &

etcd --name m3 \
  --data-dir m3.etcd
  --listen-client-urls http://127.0.0.1:2384 \
  --advertise-client-urls http://127.0.0.1:2384 \
  --listen-peer-urls http://127.0.0.1:2382 &

3. 验证恢复后的集群

确保集群启动成功后,可以通过以下命令检查节点状态:

复制代码
etcdctl endpoint status --cluster

输出应包含所有节点的健康状态和元数据,表明集群已成功恢复。

四、注意事项

  1. 备份频率:根据业务需要,定期执行快照备份,确保数据安全。
  2. 权限配置:备份与还原操作需具有相应权限,避免数据泄露。
  3. 版本兼容性:确保 etcdctl、etcdutl 与 etcd 集群的版本一致。
  4. 测试还原:在生产环境中使用前,建议在测试环境中验证备份与还原流程。

五、总结

本文基于启动脚本,详细讲解了 etcd 集群的备份与还原操作。通过备份,保障数据的持久性与安全性;通过还原,快速恢复数据并确保业务连续性。

相关推荐
苏渡苇9 小时前
Spring Cloud Alibaba:将 Sentinel 熔断限流规则持久化到 Nacos 配置中心
数据库·spring boot·mysql·spring cloud·nacos·sentinel·持久化
杨云龙UP9 小时前
Oracle Recycle Bin 回收站详解:DROP TABLE 后还能找回吗?
linux·运维·数据库·sql·mysql·oracle
未来之窗软件服务10 小时前
酒店门锁V10SDK接口VB-幽冥大陆(一百26)—东方仙盟
数据库·酒店门锁·仙盟创梦ide·东方仙盟·东方仙盟sdk·东方仙盟幽冥大陆
墨_风10 小时前
MyBatis时间区间查询异常排查(达梦数据库)
数据库·mybatis·达梦
njsgcs11 小时前
用clip把设计经验变成向量数据库,然后每秒检索可以检查3维模型设计的错误吗
数据库
WiChP11 小时前
【V0.1B10】从零开始的2D游戏引擎开发之路
java·数据库·游戏引擎
小当家.10511 小时前
PostgreSQL 做向量数据库:pgvector 在 RAG 中的实战与多场景适配
数据库·人工智能·postgresql·rag
Access开发易登软件11 小时前
Access 和 SQLite,根本不在一个赛道上
java·jvm·数据库·sqlite·excel·vba·access开发
一 乐12 小时前
疫苗发布和接种预约|基于Java+vue疫苗发布和接种预约系统设计与实现(源码+数据库+文档)
java·数据库·vue.js·spring boot·论文·毕设·疫苗发布和接种预约系统系统
Navicat中国12 小时前
如何专业化地导出数据
数据库·导出数据·navicat·数据