如何使用 pg_rman 进行 PostgreSQL 的备份与恢复

概述

PostgreSQL 是一种非常流行的开源关系型数据库管理系统,广泛应用于众多生产环境中。为了确保生产环境始终正常运行,您需要使用多种工具,其中备份与恢复工具是必不可少的。本篇博客将介绍一种专为 PostgreSQL 设计的备份与恢复工具,即 pg_rman。

什么是 pg_rman

pg_rman 是一个免费的实用程序,专为 PostgreSQL 数据库的备份与恢复设计。它可以对整个数据库集群进行物理在线备份,归档 WAL 日志和服务器日志,并在 PostgreSQL 离线时恢复特定备份。pg_rman 不仅支持主 PostgreSQL 服务器的备份,还可以从备服务器进行备份。如果您想了解更多关于 pg_rman 的信息,可以访问 github.com/ossc-db/pg_...

如何设置

根据您运行的 PostgreSQL 版本,本篇博客将使用 pg_rman 1.3.14,演示在 PostgreSQL 14 上的备份与恢复。

现在,假设您已正确安装 PostgreSQL 14,可以按照以下步骤设置 PostgreSQL 服务器。

bash 复制代码
mkdir pgdata_rman
initdb  -D pgdata_rman

echo "archive_mode = on" >> pgdata_rman/postgresql.conf
echo "archive_command = 'cp %p /media/david/disk1/archive/%f'" >> pgdata_rman/postgresql.conf
echo "log_directory = '/media/david/disk1/pglog'" >> pgdata_rman/postgresql.conf
pg_ctl -D pgdata_rman -l pglog/logfile start

然后,我们可以从 GitHub 检出源代码并进行编译。

go 复制代码
git clone https://github.com/ossc-db/pg_rman.git
git checkout V1.3.14 -b local
make clean && make && make install

如果没有错误,那么您已准备好使用 pg_rman 进行后续测试。

备份与恢复

在运行任何备份与恢复测试之前,我们需要初始化 pg_rman 的备份,以正确设置备份文件夹。

bash 复制代码
# 初始化备份
pg_rman init -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman 

备份文件夹初始化完成后,我们可以尝试创建几个表并插入一些数据,如下所示。

scss 复制代码
psql -d postgres -c "CREATE TABLE abc (ID INT);"
psql -d postgres -c "CREATE TABLE xyz (ID INT);"
psql -d postgres -c "INSERT INTO abc VALUES (1);"
psql -d postgres -c "INSERT INTO xyz VALUES (1);"
psql -d postgres -c "SELECT count(*) from abc;"
psql -d postgres -c "SELECT count(*) from xyz;"

现在,我们可以使用以下命令运行第一次备份:

bash 复制代码
# 进行备份
pg_rman backup --backup-mode=full --with-serverlog -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman -A /media/david/disk1/archive -S /media/david/disk1/pglog -p 5432 -d postgres

在这里,我们进行了一次完整的备份,包含所有内容以及本次完整备份的基本信息。pg_rman 会在每次备份完成后要求您验证备份。因此,要验证备份,我们可以简单运行以下命令:

bash 复制代码
# 验证
pg_rman validate -B /media/david/disk1/backup_rman

如果备份有效,那么我们可以插入更多数据并运行另一次备份。您可以按照以下步骤操作:

bash 复制代码
psql -d postgres -c "INSERT INTO abc VALUES (2);"
psql -d postgres -c "INSERT INTO xyz VALUES (2);"
psql -d postgres -c "SELECT count(*) from abc;"
psql -d postgres -c "SELECT count(*) from xyz;"

pg_rman backup --backup-mode=full --with-serverlog -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman -A /media/david/disk1/archive -S /media/david/disk1/pglog -p 5432 -d postgres 

# 验证
pg_rman validate -B /media/david/disk1/backup_rman


#### 插入更多数据
psql -d postgres -c "INSERT INTO abc VALUES (3);"
psql -d postgres -c "INSERT INTO xyz VALUES (3);"


$ pg_rman show -B /media/david/disk1/backup_rman
=====================================================================
 StartTime           EndTime              Mode    Size   TLI  Status 
=====================================================================
2022-05-27 13:05:30  2022-05-27 13:05:32  FULL    51MB     1  OK
2022-05-27 13:05:28  2022-05-27 13:05:30  FULL    51MB     1  OK

现在,我们有两个完整备份:第一个备份中每个表有一条记录,第二个备份中每个表有两条记录,而在第二个备份后,我们又向每个表插入了第三条记录。如果您现在查询这两个表,可以看到以下结果:

scss 复制代码
$ psql -d postgres -c "SELECT count(*) from abc;"
 count 
-------
     3
(1 row)

$ psql -d postgres -c "SELECT count(*) from xyz;"
 count 
-------
     3
(1 row)

假设我们在第三次操作中犯了错误,让我们停止 PostgreSQL 服务器并尝试恢复到第二个备份阶段。

bash 复制代码
# 停止
pg_ctl -D pgdata_rman -l pglog/logfile stop
 
# 恢复到目标时间
pg_rman restore -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman --recovery-target-time="2022-05-27 13:05:32"


# 重新启动
pg_ctl -D pgdata_rman -l pglog/logfile start
$ psql -d postgres -c "SELECT count(*) from abc;"
 count 
-------
     2
(1 row)

$ psql -d postgres -c "SELECT count(*) from xyz;"
 count 
-------
     2
(1 row)

如您所见,我们回到了第二个备份阶段,每个表只有两条记录。

有什么缺憾

pg_rman 是一个为 PostgreSQL 用户提供的出色免费开源工具,用于备份和恢复数据库。然而,目前它缺少一个功能,即针对特定表的恢复。作为数据库管理员,针对特定表的恢复功能可以在生产环境中降低风险,尤其是在只需要恢复单个表的情况下,这是一个明确的操作需求。

总结

在本篇博客中,我们讨论了使用免费开源工具 pg_rman 进行 PostgreSQL 备份与恢复的基础知识,希望这些信息能帮助您寻找 PostgreSQL 的免费备份与恢复解决方案。

相关推荐
野犬寒鸦2 小时前
Pipeline功能实现Redis批处理(项目批量查询点赞情况的应用)
java·服务器·数据库·redis·后端·缓存
꧁༺摩༒西༻꧂2 小时前
Spring Boot Actuator 监控功能的简介及禁用
java·数据库·spring boot
程序员JerrySUN2 小时前
当前主流GPU全景讲解:架构、功能与应用方向
数据库·人工智能·驱动开发·redis·缓存·架构
__Smile°2 小时前
kubeadm-k8s 中的 etcd 备份与恢复
数据库·docker·云原生·容器·kubernetes·etcd
Runing_WoNiu3 小时前
最佳左前缀法则(Optimal Left-Prefix Rule)
数据库·mysql
Tapdata3 小时前
一文了解增量物化视图维护(IVM):原理、演化与实践落地
数据库
码间舞4 小时前
IndexDB适用于什么场景?如何使用IndexDB?
前端·javascript·数据库
叫我:松哥4 小时前
基于Python的实习僧招聘数据采集与可视化分析,使用matplotlib进行可视化
开发语言·数据库·python·课程设计·matplotlib·文本挖掘
hzk的学习笔记4 小时前
Redis学习总结(持续更新)
数据库·redis·缓存