一、 注意事项
pg_archivecleanup代码中仅进行了wal日志文件名的对比,没有实现对WAL日志名及对应生成时间的判断。在WAL日志未被重命名时,时间与日志名顺序名一致,没有问题。一旦WAL日志被重命名,pg_archivecleanup清理就可能清理掉比指定文件更新的WAL日志。
因此,在涉及主从尤其是有lag的情况下,非必要不建议使用。
            
            
              cpp
              
              
            
          
                      if ((IsXLogFileName(walfile) || IsPartialXLogFileName(walfile)) &&
                strcmp(walfile + 8, exclusiveCleanupFileName + 8) < 0)
            {
                char        WALFilePath[MAXPGPATH * 2]; /* the file path
                                                         * including archive */
...
                rc = unlink(WALFilePath);
                if (rc != 0)
                {
                    pg_log_error("could not remove file \"%s\": %m",
                                 WALFilePath);
                    break;
                }
            }二、 清理步骤
真正到了必要的时刻,例如剩余磁盘空间已不足10%甚至5%,必须先检查从库所需日志与待清理日志间的新旧。
1. 检查从库所需日志
|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| select pg_walfile_name(sent_lsn) sent_wal,pg_walfile_name(write_lsn) write_wal,pg_walfile_name(replay_lsn) replay_wal,write_lag,replay_lag ``from pg_stat_replication ; ``sent_wal | write_wal | write_lag --------------------------+--------------------------+------------------ ``00000003001281A1000000BE | 00000003001281A1000000BD | 02:16:25.554727 (1 row) |
以上面结果为例,write_wal 是从库正在接收的最新日志,理论上从write_wal 对应日志往前推就可以,安全起见可以再往前推一段。
2. 确认待清理日志
例如当前write_wal为 00000003001281A1000000BD,那么清理00000003001281A100000000之前的日志应该是安全的。
检查两个文件是否存在
|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| -``bash``-4.2$ ``cd $PGDATA``/pg_wal -``bash``-4.2$ ll -h 00000003001281A1000000BD -rw-------. 1 postgres dba 16M Jul 24 08:57 00000003001281A1000000BD -``bash``-4.2$ -``bash``-4.2$ ll -h 00000003001281A100000000 -rw-------. 1 postgres dba 16M Jul 24 08:56 00000003001281A100000000 |
3. dryrun pg_archivecleanup
先检查运行命令之后哪些文件将会被清理,有没有大于write_wal的。当然,在删除量特别大时,基本只能抽查或者搜索。
|-----------------------------------------------------------------------|
| pg_archivecleanup -d -n $PGDATA``/pg_wal 00000003001281A100000000 |
4. 清理日志
真正执行清理
|--------------------------------------------------------------------|
| pg_archivecleanup -d $PGDATA``/pg_wal 00000003001281A100000000 |
5. 清理后检查
检查主从延迟是否还正常运行,若已中断,则下面查询无结果
|--------------------------------------------|
| select * ``from pg_stat_replication; |
检查旧日志是否已清理
根据前面-n或者-d的输出,抽查一些日志看是否还存在,检查磁盘空间是否已释放。