Transaction numbers不一致会导致跨分片事务失败,因各分片事务号须严格单调递增且全局对齐;若某分片缓存未及时刷新或同步延迟,会触发TransactionTooOld错误。为什么 Transaction numbers 不一致会导致跨分片事务直接失败MongoDB 4.2+ 的跨分片事务依赖所有参与分片的 transaction number 严格单调递增且全局对齐。一旦某个分片(尤其是 mongos 路由到的任意一个 shard)的 logicalSessionCacheRefreshPeriodMS 配置过大,或该分片长时间未与 config server 同步,它的事务计数器就可能落后------此时发起事务,mongos 会收到 InvalidOptions: transaction number is older than the latest seen 或类似 TransactionTooOld 错误。检查每个分片的实时事务号:连接到各 shard 直接执行 db.runCommand({getLastError: 1}),观察返回中的 txnNumber 是否明显滞后强制刷新逻辑会话缓存:在每个 shard 上执行 db.adminCommand({refreshLogicalSessionCacheNow: 1})(注意这不是原子操作,需逐个调用)生产环境更稳妥的做法是调小 logicalSessionCacheRefreshPeriodMS(默认 300000ms → 建议设为 30000),并在滚动重启分片时确认该配置已生效maxTimeMS 在跨分片事务里不是超时保险丝你给 session.startTransaction({maxTimeMS: 5000}),不代表整个两阶段提交(2PC)会在 5 秒内回滚。这个参数只约束「主协调者(coordinator shard)上事务主操作的执行时间」,不包含 prepare 阶段广播、其他分片响应延迟、commit/abort 消息往返等网络和协调开销。实际事务卡住十几秒甚至分钟级后才报错,非常常见。真实瓶颈常在 prepare 阶段:某个分片因锁争用或慢查询无法及时返回 prepare 响应,整个事务就挂起,直到 transactionLifetimeLimitSeconds(默认 60)触发自动 abort不要依赖 maxTimeMS 做业务超时控制;应用层必须自己设外层定时器,在 session.commitTransaction() 或 session.abortTransaction() 调用前主动中断开启 sh.setShardingBalancer( { waitForDelete: true } ) 类似操作时,务必避开事务高峰期------这类管理命令会短暂阻塞分片上的 prepare 流程哪些写操作根本不能放进跨分片事务MongoDB 明确禁止在跨分片事务中执行某些命令,不是性能问题,而是架构层面不可行。比如对 config 数据库的任何写入、system.* 集合操作、createCollection(即使目标库已分片)、以及所有涉及非分片集合(unsharded collection)的写操作------只要事务里混了哪怕一条,整个事务启动就会立刻失败,报 IllegalOperation: Cannot perform operation X in a multi-document transaction on a sharded cluster。 通义听悟 阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。
相关推荐
荣码11 小时前
LangGraph多Agent协作:3个Agent干活比1个强,但我踩了4个坑用户8356290780511 天前
Python 操作 PDF 附件:添加、查看与管理指南Databend1 天前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路宇宙之一粟1 天前
乐企版式文件生成平台学测绘的小杨2 天前
CompassFusion:一个从 GNSS 到 GNSS/INS 组合导航的独立工程包ClouGence2 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因zzzzzz3102 天前
当产品经理说这个很简单:我用Python自动化处理奇葩需求的实战指南雪隐2 天前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!飞将2 天前
从零实现数据库(2)——HashIndex + IndexManager兵慌码乱3 天前
面向桌面端的资产管理系统分层架构设计与核心模块实现