postgressql——事务提交会通过delayChkpt阻塞checkpoint(9)

事务提交会通过delayChkpt阻塞checkpoint

Postgresql事务在事务提交时(执行commit的最后阶段)会通过加锁阻塞checkpoint的执行,尽管时间非常短,分析为什么需要这样做:

首先看提交堆栈

复制代码
#1  0x0000000000539175 in CommitTransaction () at xact.c:2079
#2  0x0000000000539e04 in CommitTransactionCommand () at xact.c:2824
#3  0x000000000087d1ea in finish_xact_command () at postgres.c:2482
#4  0x000000000087af27 in exec_simple_query (query_string=0x24050e0 "insert into t1 values (1,1);") at postgres.c:1154

函数调用过程

关键函数如下:

复制代码
CommitTransaction
    ...
    latestXid = RecordTransactionCommit();
    ...
        BufmgrCommit()
        START_CRIT_SECTION()
        【关键流程】
        END_CRIT_SECTION()
        latestXid = TransactionIdLatest(xid, nchildren, children);
        SyncRepWaitForLSN(XactLastRecEnd, true);
        return latestXid;
    ...
    ProcArrayEndTransaction(MyProc, latestXid);
    
    ...
    // clean ...

关键流程

delayChkpt阻塞checkpoint发生位置:

  1. 事务提交配置delayChkpt

    RecordTransactionCommit
    ...
    START_CRIT_SECTION();
    MyPgXact->delayChkpt = true;
    /* 写XLOG:COMMIT /
    /
    写CLOG:内存写不刷盘 */
    MyPgXact->delayChkpt = false;
    ...

  2. CreateCheckPoint等待delayChkpt
    联动CreateCheckPoint,会在【2】等在所有Xact的delayChkpt为false才能继续

    CreateCheckPoint
    // 【1】计算位置(重要)
    WALInsertLockAcquireExclusive();
    curInsert = XLogBytePosToRecPtr(Insert->CurrBytePos);
    freespace = INSERT_FREESPACE(curInsert);
    if (freespace == 0)
    {
    if (curInsert % XLogSegSize == 0)
    curInsert += SizeOfXLogLongPHD;
    else
    curInsert += SizeOfXLogShortPHD;
    }
    checkPoint.redo = curInsert;
    RedoRecPtr = XLogCtl->Insert.RedoRecPtr = checkPoint.redo;
    WALInsertLockRelease();

    复制代码
     // 【2】通过delayChkpt等其他所有正在提交中、正在写日志的事务
     vxids = GetVirtualXIDsDelayingChkpt(&nvxids);
     if (nvxids > 0)
     {
     	do
     	{
     		pg_usleep(10000L);	/* wait for 10 msec */
     	} while (HaveVirtualXIDsDelayingChkpt(vxids, nvxids));
     }
     pfree(vxids);

    // 【3】刷数据
    CheckPointGuts(checkPoint.redo, flags);
    // 【4】记chkpt日志
    XLogBeginInsert();
    XLogRegisterData((char *) (&checkPoint), sizeof(checkPoint));
    recptr = XLogInsert(RM_XLOG_ID,
    shutdown ? XLOG_CHECKPOINT_SHUTDOWN :
    XLOG_CHECKPOINT_ONLINE);

    复制代码
     XLogFlush(recptr);

为什么checkpoint需要等事务提交

确定REDO位点是在createCheckpoint的函数前面执行的,checkpoint和事务提交并发会有下面三种情况发生(假设没有delayChkpt会有情况二发生)

情况一:redo point在commit提交前,那么如果crash发生了,redo过程会覆盖这条xlog,不会有问题

情况二:如果没有delayChkpt,redo point可能发生在上图中的位置(然后checkpoint刷完数据后,当前事务才写clog),XLOG已经先写了,如果crash发生了,redo过程不会覆盖这条xlog,而且clog信息不存在,那么commit信息彻底丢掉了。

情况三:redo point在事务提交后,redo时xlog虽然还是做不到,但是clog一定会被刷下去,所以我们不会丢失事务提交信息。

相关推荐
吃胖点儿7 分钟前
RAG系统优化完整路径:从30%到90%准确率的工程实践
服务器·数据库·windows
日取其半万世不竭9 分钟前
Docker Compose 服务备份方案:配置、数据和数据库怎么打包
数据库·docker·容器
Anokata13 分钟前
MYSQL 网络连接
数据库·mysql
蜜獾云19 分钟前
mongoDB之分片集群
数据库·mongodb
码不停蹄的玄黓32 分钟前
MySQL索引设计核心注意事项
android·数据库·mysql
Gauss松鼠会44 分钟前
GaussDB(DWS)性能问题处理套路
服务器·数据库·postgresql·性能优化·gaussdb
AllData公司负责人1 小时前
亲测丝滑,体验跃迁|AllData通过集成开源项目RustFS,多模态数据存储新范式
java·大数据·数据库·算法·数据分析·rustfs
SelectDB技术团队1 小时前
97% 召回率、900 QPS:Apache Doris 4.1 生产级向量检索的工程实践
数据库·人工智能·数据分析·apache doris·selectdb
Trouvaille ~1 小时前
【Redis篇】Hash 哈希:字段级操作与对象存储的最佳实践
数据库·redis·后端·算法·缓存·哈希算法·键值对
happyprince1 小时前
10-Hugging Face Transformers 量化系统深度分析
java·前端·数据库