如何使用 pg_rman 进行 PostgreSQL 的备份与恢复

概述

PostgreSQL 是一种非常流行的开源关系型数据库管理系统,广泛应用于众多生产环境中。为了确保生产环境始终正常运行,您需要使用多种工具,其中备份与恢复工具是必不可少的。本篇博客将介绍一种专为 PostgreSQL 设计的备份与恢复工具,即 pg_rman。

什么是 pg_rman

pg_rman 是一个免费的实用程序,专为 PostgreSQL 数据库的备份与恢复设计。它可以对整个数据库集群进行物理在线备份,归档 WAL 日志和服务器日志,并在 PostgreSQL 离线时恢复特定备份。pg_rman 不仅支持主 PostgreSQL 服务器的备份,还可以从备服务器进行备份。如果您想了解更多关于 pg_rman 的信息,可以访问 github.com/ossc-db/pg_...

如何设置

根据您运行的 PostgreSQL 版本,本篇博客将使用 pg_rman 1.3.14,演示在 PostgreSQL 14 上的备份与恢复。

现在,假设您已正确安装 PostgreSQL 14,可以按照以下步骤设置 PostgreSQL 服务器。

bash 复制代码
mkdir pgdata_rman
initdb  -D pgdata_rman

echo "archive_mode = on" >> pgdata_rman/postgresql.conf
echo "archive_command = 'cp %p /media/david/disk1/archive/%f'" >> pgdata_rman/postgresql.conf
echo "log_directory = '/media/david/disk1/pglog'" >> pgdata_rman/postgresql.conf
pg_ctl -D pgdata_rman -l pglog/logfile start

然后,我们可以从 GitHub 检出源代码并进行编译。

go 复制代码
git clone https://github.com/ossc-db/pg_rman.git
git checkout V1.3.14 -b local
make clean && make && make install

如果没有错误,那么您已准备好使用 pg_rman 进行后续测试。

备份与恢复

在运行任何备份与恢复测试之前,我们需要初始化 pg_rman 的备份,以正确设置备份文件夹。

bash 复制代码
# 初始化备份
pg_rman init -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman 

备份文件夹初始化完成后,我们可以尝试创建几个表并插入一些数据,如下所示。

scss 复制代码
psql -d postgres -c "CREATE TABLE abc (ID INT);"
psql -d postgres -c "CREATE TABLE xyz (ID INT);"
psql -d postgres -c "INSERT INTO abc VALUES (1);"
psql -d postgres -c "INSERT INTO xyz VALUES (1);"
psql -d postgres -c "SELECT count(*) from abc;"
psql -d postgres -c "SELECT count(*) from xyz;"

现在,我们可以使用以下命令运行第一次备份:

bash 复制代码
# 进行备份
pg_rman backup --backup-mode=full --with-serverlog -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman -A /media/david/disk1/archive -S /media/david/disk1/pglog -p 5432 -d postgres

在这里,我们进行了一次完整的备份,包含所有内容以及本次完整备份的基本信息。pg_rman 会在每次备份完成后要求您验证备份。因此,要验证备份,我们可以简单运行以下命令:

bash 复制代码
# 验证
pg_rman validate -B /media/david/disk1/backup_rman

如果备份有效,那么我们可以插入更多数据并运行另一次备份。您可以按照以下步骤操作:

bash 复制代码
psql -d postgres -c "INSERT INTO abc VALUES (2);"
psql -d postgres -c "INSERT INTO xyz VALUES (2);"
psql -d postgres -c "SELECT count(*) from abc;"
psql -d postgres -c "SELECT count(*) from xyz;"

pg_rman backup --backup-mode=full --with-serverlog -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman -A /media/david/disk1/archive -S /media/david/disk1/pglog -p 5432 -d postgres 

# 验证
pg_rman validate -B /media/david/disk1/backup_rman


#### 插入更多数据
psql -d postgres -c "INSERT INTO abc VALUES (3);"
psql -d postgres -c "INSERT INTO xyz VALUES (3);"


$ pg_rman show -B /media/david/disk1/backup_rman
=====================================================================
 StartTime           EndTime              Mode    Size   TLI  Status 
=====================================================================
2022-05-27 13:05:30  2022-05-27 13:05:32  FULL    51MB     1  OK
2022-05-27 13:05:28  2022-05-27 13:05:30  FULL    51MB     1  OK

现在,我们有两个完整备份:第一个备份中每个表有一条记录,第二个备份中每个表有两条记录,而在第二个备份后,我们又向每个表插入了第三条记录。如果您现在查询这两个表,可以看到以下结果:

scss 复制代码
$ psql -d postgres -c "SELECT count(*) from abc;"
 count 
-------
     3
(1 row)

$ psql -d postgres -c "SELECT count(*) from xyz;"
 count 
-------
     3
(1 row)

假设我们在第三次操作中犯了错误,让我们停止 PostgreSQL 服务器并尝试恢复到第二个备份阶段。

bash 复制代码
# 停止
pg_ctl -D pgdata_rman -l pglog/logfile stop
 
# 恢复到目标时间
pg_rman restore -B /media/david/disk1/backup_rman -D /media/david/disk1/pgdata_rman --recovery-target-time="2022-05-27 13:05:32"


# 重新启动
pg_ctl -D pgdata_rman -l pglog/logfile start
$ psql -d postgres -c "SELECT count(*) from abc;"
 count 
-------
     2
(1 row)

$ psql -d postgres -c "SELECT count(*) from xyz;"
 count 
-------
     2
(1 row)

如您所见,我们回到了第二个备份阶段,每个表只有两条记录。

有什么缺憾

pg_rman 是一个为 PostgreSQL 用户提供的出色免费开源工具,用于备份和恢复数据库。然而,目前它缺少一个功能,即针对特定表的恢复。作为数据库管理员,针对特定表的恢复功能可以在生产环境中降低风险,尤其是在只需要恢复单个表的情况下,这是一个明确的操作需求。

总结

在本篇博客中,我们讨论了使用免费开源工具 pg_rman 进行 PostgreSQL 备份与恢复的基础知识,希望这些信息能帮助您寻找 PostgreSQL 的免费备份与恢复解决方案。

相关推荐
毕设十刻12 小时前
基于vue的考研信息系统6kv17(程序 + 源码 + 数据库 + 调试部署 + 开发环境配置),配套论文文档字数达万字以上,文末可获取,系统界面展示置于文末
前端·数据库·vue.js
龙茶清欢12 小时前
PostgreSQL 和 MySQL两个数据库的索引的区别
数据库·mysql·postgresql
望获linux12 小时前
论文解读:利用中断隔离技术的 Linux 亚微秒响应性能优化
java·linux·运维·前端·arm开发·数据库·性能优化
柱子jason12 小时前
使用IOT-Tree消息流InfluxDB模块节点实现标签数据的时序数据库存储
数据库·物联网·时序数据库·influxdb·iot-tree
TDengine (老段)12 小时前
TDengine 聚合函数 ELAPSED 用户手册
java·大数据·数据库·sql·物联网·时序数据库·tdengine
TDengine (老段)12 小时前
TDengine 聚合函数 HYPERLOGLOG 用户手册
大数据·数据库·物联网·哈希算法·时序数据库·iot·tdengine
Elastic 中国社区官方博客13 小时前
使用 Elasticsearch 构建 AI Agentic 工作流
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
kobe_OKOK_13 小时前
django 使用绑定多个数据库实现数据的同步
数据库·python·django
麦兜*13 小时前
Spring Boot 项目 Docker 化:从零到一的完整实战指南
数据库·spring boot·redis·后端·spring·缓存·docker
zl97989913 小时前
MySQL-数据库日志
数据库·mysql·database