pg_archivecleanup清理wal日志

一、 注意事项

pg_archivecleanup代码中仅进行了wal日志文件名的对比,没有实现对WAL日志名及对应生成时间的判断。在WAL日志未被重命名时,时间与日志名顺序名一致,没有问题。一旦WAL日志被重命名,pg_archivecleanup清理就可能清理掉比指定文件更新的WAL日志。

因此,在涉及主从尤其是有lag的情况下,非必要不建议使用。

cpp 复制代码
            if ((IsXLogFileName(walfile) || IsPartialXLogFileName(walfile)) &&
                strcmp(walfile + 8, exclusiveCleanupFileName + 8) < 0)
            {
                char        WALFilePath[MAXPGPATH * 2]; /* the file path
                                                         * including archive */
...
                rc = unlink(WALFilePath);
                if (rc != 0)
                {
                    pg_log_error("could not remove file \"%s\": %m",
                                 WALFilePath);
                    break;
                }
            }

二、 清理步骤

真正到了必要的时刻,例如剩余磁盘空间已不足10%甚至5%,必须先检查从库所需日志与待清理日志间的新旧。

1. 检查从库所需日志

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| select pg_walfile_name(sent_lsn) sent_wal,pg_walfile_name(write_lsn) write_wal,pg_walfile_name(replay_lsn) replay_wal,write_lag,replay_lag ``from pg_stat_replication ; ``sent_wal | write_wal | write_lag --------------------------+--------------------------+------------------ ``00000003001281A1000000BE | 00000003001281A1000000BD | 02:16:25.554727 (1 row) |

以上面结果为例,write_wal 是从库正在接收的最新日志,理论上从write_wal 对应日志往前推就可以,安全起见可以再往前推一段。

2. 确认待清理日志

例如当前write_wal为 00000003001281A1000000BD,那么清理00000003001281A100000000之前的日志应该是安全的。

检查两个文件是否存在

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| -``bash``-4.2$ ``cd $PGDATA``/pg_wal -``bash``-4.2$ ll -h 00000003001281A1000000BD -rw-------. 1 postgres dba 16M Jul 24 08:57 00000003001281A1000000BD -``bash``-4.2$ -``bash``-4.2$ ll -h 00000003001281A100000000 -rw-------. 1 postgres dba 16M Jul 24 08:56 00000003001281A100000000 |

3. dryrun pg_archivecleanup

先检查运行命令之后哪些文件将会被清理,有没有大于write_wal的。当然,在删除量特别大时,基本只能抽查或者搜索。

|-----------------------------------------------------------------------|
| pg_archivecleanup -d -n $PGDATA``/pg_wal 00000003001281A100000000 |

4. 清理日志

真正执行清理

|--------------------------------------------------------------------|
| pg_archivecleanup -d $PGDATA``/pg_wal 00000003001281A100000000 |

5. 清理后检查

检查主从延迟是否还正常运行,若已中断,则下面查询无结果

|--------------------------------------------|
| select * ``from pg_stat_replication; |

检查旧日志是否已清理

根据前面-n或者-d的输出,抽查一些日志看是否还存在,检查磁盘空间是否已释放。

相关推荐
数据知道4 小时前
PostgreSQL 核心原理:系统内部的对象寻址机制(OID 对象标识符)
数据库·postgresql
失忆爆表症5 小时前
01_项目搭建指南:从零开始的 Windows 开发环境配置
windows·postgresql·fastapi·milvus
数据知道1 天前
PostgreSQL实战:详解如何用Python优雅地从PG中存取处理JSON
python·postgresql·json
HoneyMoose1 天前
PostgreSQL 创建用户表的时候提示 user 错误
postgresql
吾日三省吾码1 天前
别只会“加索引”了!这 3 个 PostgreSQL 反常识优化,能把性能和成本一起打下来
数据库·postgresql
七牛云行业应用1 天前
Moltbook一夜崩盘:150万密钥泄露背后的架构“死穴”与重构实战
网络安全·postgresql·架构·高并发·七牛云
AskHarries1 天前
Debian 12 环境下 PostgreSQL 15 部署与安全配置
postgresql
资深web全栈开发2 天前
PostgreSQL枚举还是字符串:ENUM vs VARCHAR + CHECK 的权衡
数据库·postgresql
Aaron_Wjf2 天前
PG Vector测试
数据库·postgresql
Aaron_Wjf2 天前
PG逻辑复制槽应用
数据库·postgresql