PostgreSQL主从切换后时间线修复操作手册

当PostgreSQL发生主从切换导致时间线分裂时,可以通过pg_rewind工具来修复。

触发时间线分裂时,通常会在旧主降级并连接到新主时,日志中出现如下报错并退出:

sql 复制代码
FATAL: timeline X of the primary does not match recovery target timeline Y

以下是具体的修复操作步骤:

备份配置文件

在执行pg_rewind之前,首先需要备份新主库和需要rewind的库的配置文件,以免在rewind过程中这些配置文件被修改或覆盖。重要的配置文件包括postgresql.confpg_hba.confrecovery.conf(如果存在)。

在需要rewind的库上操作:

登录到数据库服务器:

复制代码
su - postgres
ssh 172.25.100.1

停止PostgreSQL服务:

arduino 复制代码
pg_ctl stop -m fast

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

备份配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp postgresql.conf $BACKUP_DIR/postgresql.conf.bak
cp pg_hba.conf $BACKUP_DIR/pg_hba.conf.bak
if [ -f recovery.conf ]; then cp recovery.conf $BACKUP_DIR/recovery.conf.bak; fi

使用pg_rewind

pg_rewind工具用于在主从切换后,将一个之前是主库的PostgreSQL实例同步到新的主库上,以解决时间线分裂的问题。确保新主库正在运行,并且需要rewind的库已经停止。

确保新主库(172.21.100.1)正在运行。

在需要rewind的库上执行pg_rewind

ini 复制代码
# 验证(dry-run)
pg_rewind -n --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

# 实际执行
pg_rewind --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

确认pg_rewind执行完成后没有错误。

恢复配置文件

pg_rewind操作完成后,需要将之前备份的配置文件恢复到PGDATA目录。

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

恢复配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp $BACKUP_DIR/postgresql.conf.bak postgresql.conf
cp $BACKUP_DIR/pg_hba.conf.bak pg_hba.conf
if [ -f $BACKUP_DIR/recovery.conf.bak ]; then cp $BACKUP_DIR/recovery.conf.bak recovery.conf; fi

重启PostgreSQL服务

重启PostgreSQL服务,以应用pg_rewind操作和恢复的配置文件。

sql 复制代码
pg_ctl start

验证

登录到PostgreSQL数据库,检查数据是否同步,且配置是否正确。

使用psql或其他客户端工具连接到数据库:

复制代码
psql

运行一些基本的SQL命令来检查数据是否同步:

csharp 复制代码
SELECT pg_current_wal_lsn();

检查时间线是否已经修复:

csharp 复制代码
SELECT timeline_id FROM pg_control_checkpoint();

注意事项

  • 确保在执行这些操作之前,理解每一步的作用和潜在的风险。
  • 如果在使用pg_rewind时遇到任何问题,参考官方文档或寻求专业帮助。
  • 在执行pg_rewind之前,确保目标库已经完全停止,以避免数据损坏。
  • 在生产环境中操作时,建议先在测试环境进行验证。
相关推荐
Victor3564 小时前
https://editor.csdn.net/md/?articleId=139321571&spm=1011.2415.3001.9698
后端
Victor3564 小时前
Hibernate(89)如何在压力测试中使用Hibernate?
后端
灰子学技术6 小时前
go response.Body.close()导致连接异常处理
开发语言·后端·golang
Gogo8167 小时前
BigInt 与 Number 的爱恨情仇,为何大佬都劝你“能用 Number 就别用 BigInt”?
后端
fuquxiaoguang7 小时前
深入浅出:使用MDC构建SpringBoot全链路请求追踪系统
java·spring boot·后端·调用链分析
毕设源码_廖学姐7 小时前
计算机毕业设计springboot招聘系统网站 基于SpringBoot的在线人才对接平台 SpringBoot驱动的智能求职与招聘服务网
spring boot·后端·课程设计
野犬寒鸦9 小时前
从零起步学习并发编程 || 第六章:ReentrantLock与synchronized 的辨析及运用
java·服务器·数据库·后端·学习·算法
逍遥德9 小时前
如何学编程之01.理论篇.如何通过阅读代码来提高自己的编程能力?
前端·后端·程序人生·重构·软件构建·代码规范
MX_935910 小时前
Spring的bean工厂后处理器和Bean后处理器
java·后端·spring
程序员泠零澪回家种桔子11 小时前
Spring AI框架全方位详解
java·人工智能·后端·spring·ai·架构