PostgreSQL主从切换后时间线修复操作手册

当PostgreSQL发生主从切换导致时间线分裂时,可以通过pg_rewind工具来修复。

触发时间线分裂时,通常会在旧主降级并连接到新主时,日志中出现如下报错并退出:

sql 复制代码
FATAL: timeline X of the primary does not match recovery target timeline Y

以下是具体的修复操作步骤:

备份配置文件

在执行pg_rewind之前,首先需要备份新主库和需要rewind的库的配置文件,以免在rewind过程中这些配置文件被修改或覆盖。重要的配置文件包括postgresql.confpg_hba.confrecovery.conf(如果存在)。

在需要rewind的库上操作:

登录到数据库服务器:

复制代码
su - postgres
ssh 172.25.100.1

停止PostgreSQL服务:

arduino 复制代码
pg_ctl stop -m fast

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

备份配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp postgresql.conf $BACKUP_DIR/postgresql.conf.bak
cp pg_hba.conf $BACKUP_DIR/pg_hba.conf.bak
if [ -f recovery.conf ]; then cp recovery.conf $BACKUP_DIR/recovery.conf.bak; fi

使用pg_rewind

pg_rewind工具用于在主从切换后,将一个之前是主库的PostgreSQL实例同步到新的主库上,以解决时间线分裂的问题。确保新主库正在运行,并且需要rewind的库已经停止。

确保新主库(172.21.100.1)正在运行。

在需要rewind的库上执行pg_rewind

ini 复制代码
# 验证(dry-run)
pg_rewind -n --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

# 实际执行
pg_rewind --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

确认pg_rewind执行完成后没有错误。

恢复配置文件

pg_rewind操作完成后,需要将之前备份的配置文件恢复到PGDATA目录。

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

恢复配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp $BACKUP_DIR/postgresql.conf.bak postgresql.conf
cp $BACKUP_DIR/pg_hba.conf.bak pg_hba.conf
if [ -f $BACKUP_DIR/recovery.conf.bak ]; then cp $BACKUP_DIR/recovery.conf.bak recovery.conf; fi

重启PostgreSQL服务

重启PostgreSQL服务,以应用pg_rewind操作和恢复的配置文件。

sql 复制代码
pg_ctl start

验证

登录到PostgreSQL数据库,检查数据是否同步,且配置是否正确。

使用psql或其他客户端工具连接到数据库:

复制代码
psql

运行一些基本的SQL命令来检查数据是否同步:

csharp 复制代码
SELECT pg_current_wal_lsn();

检查时间线是否已经修复:

csharp 复制代码
SELECT timeline_id FROM pg_control_checkpoint();

注意事项

  • 确保在执行这些操作之前,理解每一步的作用和潜在的风险。
  • 如果在使用pg_rewind时遇到任何问题,参考官方文档或寻求专业帮助。
  • 在执行pg_rewind之前,确保目标库已经完全停止,以避免数据损坏。
  • 在生产环境中操作时,建议先在测试环境进行验证。
相关推荐
开心猴爷1 分钟前
iOS 应用发布流程中常被忽视的关键环节
后端
用户219916797039129 分钟前
使用Agent Framework进行多Agent工作流编排
后端
serendipity_hky35 分钟前
【go语言 | 第5篇】channel——多个goroutine之间通信
开发语言·后端·golang
zhaorong39 分钟前
RabbitMQ发布订阅模式同一消费者多个实例如何防止重复消费?
后端
开心猴爷40 分钟前
提升 iOS 应用安全审核通过率的一种思路,把容易被拒的点先处理
后端
我家领养了个白胖胖43 分钟前
Prompt、格式化输出、持久化ChatMemory
java·后端·ai编程
全栈老石1 小时前
别再折腾端口转发了:使用 Cloudflare Tunnel 优雅地分享你的 localhost
前端·后端·全栈
Java编程爱好者1 小时前
是猫踩键盘还是乱码?不,这是你刚写的正则表达式
后端
源代码•宸1 小时前
分布式缓存-GO(简历写法、常见面试题)
服务器·开发语言·经验分享·分布式·后端·缓存·golang