postgressql——事务提交会通过delayChkpt阻塞checkpoint(9)

事务提交会通过delayChkpt阻塞checkpoint

Postgresql事务在事务提交时(执行commit的最后阶段)会通过加锁阻塞checkpoint的执行,尽管时间非常短,分析为什么需要这样做:

首先看提交堆栈

复制代码
#1  0x0000000000539175 in CommitTransaction () at xact.c:2079
#2  0x0000000000539e04 in CommitTransactionCommand () at xact.c:2824
#3  0x000000000087d1ea in finish_xact_command () at postgres.c:2482
#4  0x000000000087af27 in exec_simple_query (query_string=0x24050e0 "insert into t1 values (1,1);") at postgres.c:1154

函数调用过程

关键函数如下:

复制代码
CommitTransaction
    ...
    latestXid = RecordTransactionCommit();
    ...
        BufmgrCommit()
        START_CRIT_SECTION()
        【关键流程】
        END_CRIT_SECTION()
        latestXid = TransactionIdLatest(xid, nchildren, children);
        SyncRepWaitForLSN(XactLastRecEnd, true);
        return latestXid;
    ...
    ProcArrayEndTransaction(MyProc, latestXid);
    
    ...
    // clean ...

关键流程

delayChkpt阻塞checkpoint发生位置:

  1. 事务提交配置delayChkpt

    RecordTransactionCommit
    ...
    START_CRIT_SECTION();
    MyPgXact->delayChkpt = true;
    /* 写XLOG:COMMIT /
    /
    写CLOG:内存写不刷盘 */
    MyPgXact->delayChkpt = false;
    ...

  2. CreateCheckPoint等待delayChkpt
    联动CreateCheckPoint,会在【2】等在所有Xact的delayChkpt为false才能继续

    CreateCheckPoint
    // 【1】计算位置(重要)
    WALInsertLockAcquireExclusive();
    curInsert = XLogBytePosToRecPtr(Insert->CurrBytePos);
    freespace = INSERT_FREESPACE(curInsert);
    if (freespace == 0)
    {
    if (curInsert % XLogSegSize == 0)
    curInsert += SizeOfXLogLongPHD;
    else
    curInsert += SizeOfXLogShortPHD;
    }
    checkPoint.redo = curInsert;
    RedoRecPtr = XLogCtl->Insert.RedoRecPtr = checkPoint.redo;
    WALInsertLockRelease();

    复制代码
     // 【2】通过delayChkpt等其他所有正在提交中、正在写日志的事务
     vxids = GetVirtualXIDsDelayingChkpt(&nvxids);
     if (nvxids > 0)
     {
     	do
     	{
     		pg_usleep(10000L);	/* wait for 10 msec */
     	} while (HaveVirtualXIDsDelayingChkpt(vxids, nvxids));
     }
     pfree(vxids);

    // 【3】刷数据
    CheckPointGuts(checkPoint.redo, flags);
    // 【4】记chkpt日志
    XLogBeginInsert();
    XLogRegisterData((char *) (&checkPoint), sizeof(checkPoint));
    recptr = XLogInsert(RM_XLOG_ID,
    shutdown ? XLOG_CHECKPOINT_SHUTDOWN :
    XLOG_CHECKPOINT_ONLINE);

    复制代码
     XLogFlush(recptr);

为什么checkpoint需要等事务提交

确定REDO位点是在createCheckpoint的函数前面执行的,checkpoint和事务提交并发会有下面三种情况发生(假设没有delayChkpt会有情况二发生)

情况一:redo point在commit提交前,那么如果crash发生了,redo过程会覆盖这条xlog,不会有问题

情况二:如果没有delayChkpt,redo point可能发生在上图中的位置(然后checkpoint刷完数据后,当前事务才写clog),XLOG已经先写了,如果crash发生了,redo过程不会覆盖这条xlog,而且clog信息不存在,那么commit信息彻底丢掉了。

情况三:redo point在事务提交后,redo时xlog虽然还是做不到,但是clog一定会被刷下去,所以我们不会丢失事务提交信息。

相关推荐
砚边数影3 分钟前
AI开发依赖引入:DL4J / Java-ML 框架 Maven 坐标配置
java·数据库·人工智能·深度学习·机器学习·ai·maven
砚边数影5 分钟前
AI环境搭建(一):JDK17 + Maven 配置,Java开发环境标准化流程
数据库·人工智能·ai·ai编程
檀越剑指大厂13 分钟前
金仓数据库以“多模融合”引领文档数据库国产化新篇章
数据库
煎蛋学姐15 分钟前
SSM星河书城9p6tr(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·用户管理·ssm 框架·星河书城·线上书城
jason成都1 小时前
实战 | 国产数据库 R2DBC-JDBC 桥接踩坑记 - JetLinks适配达梦数据库
java·数据库·物联网
Elastic 中国社区官方博客1 小时前
使用 Elasticsearch 管理 agentic 记忆
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
小宇的天下1 小时前
Calibre 3Dstack --每日一个命令day13【enclosure】(3-13)
服务器·前端·数据库
云和数据.ChenGuang1 小时前
达梦数据库安装服务故障四
linux·服务器·数据库·达梦数据库·达梦数据
尽兴-2 小时前
MySQL 8.0主从复制原理与实战深度解析
数据库·mysql·主从复制
Mr_sun.2 小时前
Day04——权限认证-基础
android·服务器·数据库