pg_archivecleanup清理wal日志

一、 注意事项

pg_archivecleanup代码中仅进行了wal日志文件名的对比,没有实现对WAL日志名及对应生成时间的判断。在WAL日志未被重命名时,时间与日志名顺序名一致,没有问题。一旦WAL日志被重命名,pg_archivecleanup清理就可能清理掉比指定文件更新的WAL日志。

因此,在涉及主从尤其是有lag的情况下,非必要不建议使用。

cpp 复制代码
            if ((IsXLogFileName(walfile) || IsPartialXLogFileName(walfile)) &&
                strcmp(walfile + 8, exclusiveCleanupFileName + 8) < 0)
            {
                char        WALFilePath[MAXPGPATH * 2]; /* the file path
                                                         * including archive */
...
                rc = unlink(WALFilePath);
                if (rc != 0)
                {
                    pg_log_error("could not remove file \"%s\": %m",
                                 WALFilePath);
                    break;
                }
            }

二、 清理步骤

真正到了必要的时刻,例如剩余磁盘空间已不足10%甚至5%,必须先检查从库所需日志与待清理日志间的新旧。

1. 检查从库所需日志

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| select pg_walfile_name(sent_lsn) sent_wal,pg_walfile_name(write_lsn) write_wal,pg_walfile_name(replay_lsn) replay_wal,write_lag,replay_lag ``from pg_stat_replication ; ``sent_wal | write_wal | write_lag --------------------------+--------------------------+------------------ ``00000003001281A1000000BE | 00000003001281A1000000BD | 02:16:25.554727 (1 row) |

以上面结果为例,write_wal 是从库正在接收的最新日志,理论上从write_wal 对应日志往前推就可以,安全起见可以再往前推一段。

2. 确认待清理日志

例如当前write_wal为 00000003001281A1000000BD,那么清理00000003001281A100000000之前的日志应该是安全的。

检查两个文件是否存在

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| -``bash``-4.2$ ``cd $PGDATA``/pg_wal -``bash``-4.2$ ll -h 00000003001281A1000000BD -rw-------. 1 postgres dba 16M Jul 24 08:57 00000003001281A1000000BD -``bash``-4.2$ -``bash``-4.2$ ll -h 00000003001281A100000000 -rw-------. 1 postgres dba 16M Jul 24 08:56 00000003001281A100000000 |

3. dryrun pg_archivecleanup

先检查运行命令之后哪些文件将会被清理,有没有大于write_wal的。当然,在删除量特别大时,基本只能抽查或者搜索。

|-----------------------------------------------------------------------|
| pg_archivecleanup -d -n $PGDATA``/pg_wal 00000003001281A100000000 |

4. 清理日志

真正执行清理

|--------------------------------------------------------------------|
| pg_archivecleanup -d $PGDATA``/pg_wal 00000003001281A100000000 |

5. 清理后检查

检查主从延迟是否还正常运行,若已中断,则下面查询无结果

|--------------------------------------------|
| select * ``from pg_stat_replication; |

检查旧日志是否已清理

根据前面-n或者-d的输出,抽查一些日志看是否还存在,检查磁盘空间是否已释放。

相关推荐
YMatrix 官方技术社区18 小时前
批流一体,从 Lambda 到 Domino|YMatrix 亮相 PGConf.Russia 2026,重构 PostgreSQL 极简实时架构
数据库·postgresql·重构·架构·ymatrix
腥辣甜咸19 小时前
想用队列?但我一个中间件都不想引入:PGMQ 超简单使用
postgresql
hudson202219 小时前
work_mem: 这是一个陷阱!
后端·postgresql
李长渊哦20 小时前
家用宽带动态公网 IP 下 Node + PostgreSQL 服务的 DDNS 全流程部署实践
网络协议·tcp/ip·postgresql
程序人生51820 小时前
ubuntu桌面版安装后配置允许root通过图形界面登录和ssh登录 亲测有效
ubuntu·postgresql·ssh
lbb 小魔仙20 小时前
无公网 IP 环境下的 PostgreSQL 远程访问方案:基于内网穿透技术的全流程解析
网络协议·tcp/ip·postgresql
蓦然乍醒2 天前
使用 DBeaver 还原 PostgreSQL 备份文件 (.bak) 技术文档
数据库·postgresql
l1t2 天前
DeepSeek总结的PostgreSQL使用 RDTSC 降低 EXPLAIN ANALYZE 的计时开销
数据库·postgresql
l1t2 天前
DeepSeek总结的PostgreSQL检查点和写入风暴
jvm·postgresql·oracle
丸辣,我代码炸了2 天前
用 PostgreSQL 一库模拟 MySQL / MongoDB / Redis / Elasticsearch(附 ts_rank 详解)
mysql·mongodb·postgresql