PostgreSQL主从切换后时间线修复操作手册

当PostgreSQL发生主从切换导致时间线分裂时,可以通过pg_rewind工具来修复。

触发时间线分裂时,通常会在旧主降级并连接到新主时,日志中出现如下报错并退出:

sql 复制代码
FATAL: timeline X of the primary does not match recovery target timeline Y

以下是具体的修复操作步骤:

备份配置文件

在执行pg_rewind之前,首先需要备份新主库和需要rewind的库的配置文件,以免在rewind过程中这些配置文件被修改或覆盖。重要的配置文件包括postgresql.confpg_hba.confrecovery.conf(如果存在)。

在需要rewind的库上操作:

登录到数据库服务器:

复制代码
su - postgres
ssh 172.25.100.1

停止PostgreSQL服务:

arduino 复制代码
pg_ctl stop -m fast

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

备份配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp postgresql.conf $BACKUP_DIR/postgresql.conf.bak
cp pg_hba.conf $BACKUP_DIR/pg_hba.conf.bak
if [ -f recovery.conf ]; then cp recovery.conf $BACKUP_DIR/recovery.conf.bak; fi

使用pg_rewind

pg_rewind工具用于在主从切换后,将一个之前是主库的PostgreSQL实例同步到新的主库上,以解决时间线分裂的问题。确保新主库正在运行,并且需要rewind的库已经停止。

确保新主库(172.21.100.1)正在运行。

在需要rewind的库上执行pg_rewind

ini 复制代码
# 验证(dry-run)
pg_rewind -n --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

# 实际执行
pg_rewind --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

确认pg_rewind执行完成后没有错误。

恢复配置文件

pg_rewind操作完成后,需要将之前备份的配置文件恢复到PGDATA目录。

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

恢复配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp $BACKUP_DIR/postgresql.conf.bak postgresql.conf
cp $BACKUP_DIR/pg_hba.conf.bak pg_hba.conf
if [ -f $BACKUP_DIR/recovery.conf.bak ]; then cp $BACKUP_DIR/recovery.conf.bak recovery.conf; fi

重启PostgreSQL服务

重启PostgreSQL服务,以应用pg_rewind操作和恢复的配置文件。

sql 复制代码
pg_ctl start

验证

登录到PostgreSQL数据库,检查数据是否同步,且配置是否正确。

使用psql或其他客户端工具连接到数据库:

复制代码
psql

运行一些基本的SQL命令来检查数据是否同步:

csharp 复制代码
SELECT pg_current_wal_lsn();

检查时间线是否已经修复:

csharp 复制代码
SELECT timeline_id FROM pg_control_checkpoint();

注意事项

  • 确保在执行这些操作之前,理解每一步的作用和潜在的风险。
  • 如果在使用pg_rewind时遇到任何问题,参考官方文档或寻求专业帮助。
  • 在执行pg_rewind之前,确保目标库已经完全停止,以避免数据损坏。
  • 在生产环境中操作时,建议先在测试环境进行验证。
相关推荐
lang201509281 天前
Spring Boot 官方文档精解:构建与依赖管理
java·spring boot·后端
why技术1 天前
从18w到1600w播放量,我的一点思考。
java·前端·后端
间彧1 天前
Redis Cluster vs Sentinel模式区别
后端
间彧1 天前
🛡️ 构建高可用缓存架构:Redis集群与Caffeine多级缓存实战
后端
间彧1 天前
构建本地缓存(如Caffeine)+ 分布式缓存(如Redis集群)的二级缓存架构
后端
程序猿DD1 天前
Java 25 中的 6 个新特性解读
java·后端
稻草猫.1 天前
文件 IO
java·笔记·后端·java-ee·idea
掘金码甲哥1 天前
有关CORS跨域访问,这事没完
后端
码事漫谈1 天前
从外行到AI指挥官:你必须掌握的五大「程序员思维」
后端
Moonbit1 天前
MoonBit 开发者激励计划开启|赢取价值 $20 Copilot 月卡权益!
后端