Transaction numbers不一致会导致跨分片事务失败,因各分片事务号须严格单调递增且全局对齐;若某分片缓存未及时刷新或同步延迟,会触发TransactionTooOld错误。为什么 Transaction numbers 不一致会导致跨分片事务直接失败MongoDB 4.2+ 的跨分片事务依赖所有参与分片的 transaction number 严格单调递增且全局对齐。一旦某个分片(尤其是 mongos 路由到的任意一个 shard)的 logicalSessionCacheRefreshPeriodMS 配置过大,或该分片长时间未与 config server 同步,它的事务计数器就可能落后------此时发起事务,mongos 会收到 InvalidOptions: transaction number is older than the latest seen 或类似 TransactionTooOld 错误。检查每个分片的实时事务号:连接到各 shard 直接执行 db.runCommand({getLastError: 1}),观察返回中的 txnNumber 是否明显滞后强制刷新逻辑会话缓存:在每个 shard 上执行 db.adminCommand({refreshLogicalSessionCacheNow: 1})(注意这不是原子操作,需逐个调用)生产环境更稳妥的做法是调小 logicalSessionCacheRefreshPeriodMS(默认 300000ms → 建议设为 30000),并在滚动重启分片时确认该配置已生效maxTimeMS 在跨分片事务里不是超时保险丝你给 session.startTransaction({maxTimeMS: 5000}),不代表整个两阶段提交(2PC)会在 5 秒内回滚。这个参数只约束「主协调者(coordinator shard)上事务主操作的执行时间」,不包含 prepare 阶段广播、其他分片响应延迟、commit/abort 消息往返等网络和协调开销。实际事务卡住十几秒甚至分钟级后才报错,非常常见。真实瓶颈常在 prepare 阶段:某个分片因锁争用或慢查询无法及时返回 prepare 响应,整个事务就挂起,直到 transactionLifetimeLimitSeconds(默认 60)触发自动 abort不要依赖 maxTimeMS 做业务超时控制;应用层必须自己设外层定时器,在 session.commitTransaction() 或 session.abortTransaction() 调用前主动中断开启 sh.setShardingBalancer( { waitForDelete: true } ) 类似操作时,务必避开事务高峰期------这类管理命令会短暂阻塞分片上的 prepare 流程哪些写操作根本不能放进跨分片事务MongoDB 明确禁止在跨分片事务中执行某些命令,不是性能问题,而是架构层面不可行。比如对 config 数据库的任何写入、system.* 集合操作、createCollection(即使目标库已分片)、以及所有涉及非分片集合(unsharded collection)的写操作------只要事务里混了哪怕一条,整个事务启动就会立刻失败,报 IllegalOperation: Cannot perform operation X in a multi-document transaction on a sharded cluster。 通义听悟 阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。
相关推荐
其实防守也摸鱼1 分钟前
CTF密码学综合教学指南--第九章砚底藏山河4 分钟前
Python量化开发:2026最佳实时股票数据API接口推荐与对比倔强的石头_12 分钟前
kingbase备份与恢复实战(六)—— 备份自动化与保留策略:Windows任务计划+日志追溯研究点啥好呢1 小时前
专为求职者开发的“面馆”!!!摆脱面试焦虑!!!轻刀快马1 小时前
别被 ORM 框架宠坏了:从一场“订单消失”悬案,看懂 MySQL 为什么要强推 InnoDBDFT计算杂谈2 小时前
自动化脚本一键绘制三元化合物相图EW Frontier2 小时前
6G ISAC新范式:基于智能漏波天线的Wi‑Fi通感一体化系统设计与实测【附MATLAB+python代码】姚青&2 小时前
测试技术体系南境十里·墨染春水2 小时前
C++日志 2——实现单线程日志系统后端漫漫3 小时前
Redis 客户端工具体系