PostgreSQL主从切换后时间线修复操作手册

当PostgreSQL发生主从切换导致时间线分裂时,可以通过pg_rewind工具来修复。

触发时间线分裂时,通常会在旧主降级并连接到新主时,日志中出现如下报错并退出:

sql 复制代码
FATAL: timeline X of the primary does not match recovery target timeline Y

以下是具体的修复操作步骤:

备份配置文件

在执行pg_rewind之前,首先需要备份新主库和需要rewind的库的配置文件,以免在rewind过程中这些配置文件被修改或覆盖。重要的配置文件包括postgresql.confpg_hba.confrecovery.conf(如果存在)。

在需要rewind的库上操作:

登录到数据库服务器:

复制代码
su - postgres
ssh 172.25.100.1

停止PostgreSQL服务:

arduino 复制代码
pg_ctl stop -m fast

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

备份配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp postgresql.conf $BACKUP_DIR/postgresql.conf.bak
cp pg_hba.conf $BACKUP_DIR/pg_hba.conf.bak
if [ -f recovery.conf ]; then cp recovery.conf $BACKUP_DIR/recovery.conf.bak; fi

使用pg_rewind

pg_rewind工具用于在主从切换后,将一个之前是主库的PostgreSQL实例同步到新的主库上,以解决时间线分裂的问题。确保新主库正在运行,并且需要rewind的库已经停止。

确保新主库(172.21.100.1)正在运行。

在需要rewind的库上执行pg_rewind

ini 复制代码
# 验证(dry-run)
pg_rewind -n --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

# 实际执行
pg_rewind --target-pgdata=/data/postgres/pgdata --source-server='host=172.21.100.1 port=1921 user=postgres password=fake_password dbname=postgres'

确认pg_rewind执行完成后没有错误。

恢复配置文件

pg_rewind操作完成后,需要将之前备份的配置文件恢复到PGDATA目录。

进入PGDATA目录:

bash 复制代码
cd /data/postgres/pgdata

恢复配置文件:

bash 复制代码
export BACKUP_DIR=/data/backup
mkdir -p $BACKUP_DIR
cp $BACKUP_DIR/postgresql.conf.bak postgresql.conf
cp $BACKUP_DIR/pg_hba.conf.bak pg_hba.conf
if [ -f $BACKUP_DIR/recovery.conf.bak ]; then cp $BACKUP_DIR/recovery.conf.bak recovery.conf; fi

重启PostgreSQL服务

重启PostgreSQL服务,以应用pg_rewind操作和恢复的配置文件。

sql 复制代码
pg_ctl start

验证

登录到PostgreSQL数据库,检查数据是否同步,且配置是否正确。

使用psql或其他客户端工具连接到数据库:

复制代码
psql

运行一些基本的SQL命令来检查数据是否同步:

csharp 复制代码
SELECT pg_current_wal_lsn();

检查时间线是否已经修复:

csharp 复制代码
SELECT timeline_id FROM pg_control_checkpoint();

注意事项

  • 确保在执行这些操作之前,理解每一步的作用和潜在的风险。
  • 如果在使用pg_rewind时遇到任何问题,参考官方文档或寻求专业帮助。
  • 在执行pg_rewind之前,确保目标库已经完全停止,以避免数据损坏。
  • 在生产环境中操作时,建议先在测试环境进行验证。
相关推荐
chenyuhao20247 分钟前
vector深度求索(上)实用篇
开发语言·数据结构·c++·后端·算法·类和对象
程序新视界35 分钟前
MySQL中的数据去重,该用DISTINCT还是GROUP BY?
数据库·后端·mysql
豌豆花下猫1 小时前
Python 潮流周刊#121:工程师如何做出高效决策?
后端·python·ai
懒惰蜗牛2 小时前
Day24 | Java泛型通配符与边界解析
java·后端·java-ee
Eoch773 小时前
从买菜到秒杀:Redis为什么能让你的网站快如闪电?
java·后端
我不是混子3 小时前
奇葩面试题:线程调用两次start方法会怎样?
java·后端
摸鱼总工3 小时前
为什么读源码总迷路?有破解办法吗
后端
仙俊红3 小时前
深入理解 ThreadLocal —— 在 Spring Boot 中的应用与原理
java·spring boot·后端
折七4 小时前
告别传统开发痛点:AI 驱动的现代化企业级模板 Clhoria
前端·后端·node.js
白衣鸽子4 小时前
PageHelper:基于拦截器实现的SQL分页查询工具
后端·开源