【ETCD】【实操篇(十七)】 etcd 集群定期维护指南

目录

概述

为了保持 etcd 集群的可靠性,需要定期进行维护。根据 etcd 应用程序的需求,这些维护通常可以自动化进行,并且不会导致停机或性能显著下降。

所有 etcd 维护都涉及管理 etcd 键空间消耗的存储资源。如果无法有效控制键空间大小,存储空间配额将触发集群范围的警报,使系统进入受限操作的维护模式。为了避免键空间耗尽可写入空间,必须对 etcd 键空间历史进行压缩。同时,通过对 etcd 成员进行碎片整理,可以回收存储空间。此外,定期快照备份 etcd 成员状态,有助于在操作错误导致数据丢失或损坏时进行恢复。

Raft 日志保留

--snapshot-count 配置在压缩前要保留在内存中的已应用 Raft 条目数量。当达到 --snapshot-count 时,服务器会先将快照数据持久化到磁盘,然后截断旧的条目。如果一个较慢的跟随者请求的日志在压缩索引之前,领导者会发送快照,强制跟随者覆盖其状态。

较高的 --snapshot-count 会在快照之前保留更多的 Raft 条目,导致更高的内存使用率。然而,由于领导者会保留最新的 Raft 条目更长时间,较慢的跟随者有更多时间赶上快照。

从 v3.2 开始,--snapshot-count 的默认值已从 10,000 改为 100,000。

键空间历史压缩:v3 API 键值数据库

由于 etcd 会保留其键空间的完整历史,因此必须定期压缩历史数据,以避免性能下降和存储空间耗尽。历史压缩会丢弃给定修订版本之前的所有旧键值信息,从而释放存储空间供新数据写入。

  • 手动压缩
    使用 etcdctl 手动触发压缩:
shell 复制代码
$ etcdctl compact 3
  • 自动压缩
    使用 --auto-compaction-* 选项设置自动压缩周期:
shell 复制代码
$ etcd --auto-compaction-retention=1

碎片整理

在压缩键空间之后,后端数据库可能会出现内部碎片。这些碎片占据磁盘空间,但无法被主机文件系统直接使用。碎片整理的目的是将这些空间释放回文件系统。

  • 对单个成员进行碎片整理
shell 复制代码
$ etcdctl defrag
  • 对集群所有端点进行碎片整理
shell 复制代码
$ etcdctl defrag --cluster

空间配额

etcd 的空间配额确保集群的稳定运行。如果键空间过大,etcd 可能会出现性能问题,甚至耗尽存储空间,导致不可预测的集群行为。

  • 设置空间配额
shell 复制代码
$ etcd --quota-backend-bytes=$((16*1024*1024))
  • 清理空间超限告警
shell 复制代码
$ ETCDCTL_API=3 etcdctl compact $rev
$ ETCDCTL_API=3 etcdctl defrag
$ ETCDCTL_API=3 etcdctl alarm disarm

快照备份

定期对 etcd 集群进行快照备份,可作为键空间的持久备份。通过快照,etcd 集群可以恢复到特定的时间点。

  • 创建快照
shell 复制代码
$ etcdctl snapshot save backup.db
  • 检查快照状态
shell 复制代码
$ etcdutl --write-out=table snapshot status backup.db

通过以上维护操作,etcd 集群可以保持高可用性和稳定性,同时避免因存储空间不足导致的性能下降或系统故障。

相关推荐
IvorySQL9 小时前
PostgreSQL 技术日报 (3月6日)|为什么 Ctrl-C 在 psql 里让人不安?
数据库·postgresql·开源
NineData10 小时前
数据库管理工具NineData,一年进化成为数万+开发者的首选数据库工具?
运维·数据结构·数据库
IvorySQL15 小时前
PostgreSQL 技术日报 (3月5日)|规划器控制力升级,内核能力再进阶
数据库·postgresql·开源
数据组小组1 天前
免费数据库管理工具深度横评:NineData 社区版、Bytebase 社区版、Archery,2026 年开发者该选哪个?
数据库·测试·数据库管理工具·数据复制·迁移工具·ninedata社区版·naivicat平替
悟空聊架构1 天前
基于KaiwuDB在游乐场“刷卡+投币”双模消费系统中的落地实践
数据库·后端·架构
IvorySQL1 天前
PostgreSQL 技术日报 (3月4日)|硬核干货 + 内核暗流一网打尽
数据库·postgresql·开源
进击的丸子2 天前
虹软人脸服务器版SDK(Linux/ARM Pro)多线程调用及性能优化
linux·数据库·后端
NineData2 天前
NineData智能数据管理平台新功能发布|2026年1-2月
数据库·sql·数据分析
IvorySQL2 天前
双星闪耀温哥华:IvorySQL 社区两项议题入选 PGConf.dev 2026
数据库·postgresql·开源