Transaction - 记一次 Spring 事务联合 Redis 挂了引发的生产事故

问题描述

java.lang.RuntimeException: java.lang.IllegalStateException: Already value [...数据源信息...] bound to thread [[Ljava.lang.String;@231b1ae0.container-0-C-1]

上述问题是本次问题的最终结果,但并不是问题主因,之所以会引发这个问题,还需要先梳理下,我们的业务流程:针对一次入库的数据进行更新维护,先删除后新增,并且开了多线程,那么问题来了......

原因分析

我们的针对多线程事务 + 多数据源设计思路

  1. 动态数据源方法
  2. 手动更新多线程集合事务方案
  3. 手动提交/回滚事务方案(多线程)
  4. 必须在 finally 里执行,保证一定会被执行到

因为本次 Redis 突然 OOM 被打挂了,导致业务流程突然报错中断,那么如果这时候已经进入了事务操作......因为牵扯到多线程事务处理,我们需要先执行第 2 步

java 复制代码
private void updateTranSyncManager(List<TransactionStatus> transactionStatusList) {
        // err: No value for key [DynamicRoutingDataSource] bound to thread
        TransactionSynchronizationManager.bindResource(dynamicRoutingDataSource, dynamicRoutingDataSource);
        // err: Transaction synchronization is not active
        TransactionSynchronizationManager.initSynchronization();
}

把本次要提交的数据源绑定到事务管理器里,使得在第 3 步的提交或者回滚事务的时候,可以处理好本次的数据源信息,至于为什么要这么做,问 Spring,因为源码里就是要这么操作的,所以这边要遵守这个规则。

java 复制代码
private boolean transactionHandle(List<TransactionStatus> transactionStatusList, AtomicBoolean isError) {
        // 事务统一提交/回滚检验
        if (!transactionStatusList.isEmpty()) {
            if (isError.get()) {
                // 有错误, 回滚
                log.info("事务回滚...");
                transactionManager.rollback(transactionStatusList.get(0));
                log.info("事务回滚成功...");
            } else {
                // 无错误, 提交
                log.info("事务提交...");
                transactionManager.commit(transactionStatusList.get(0));
                log.info("事务提交成功...");
                return true;
            }
        }
        return false;
}

Tips1:顺便提一嘴,为什么这个是使用 get(0) 而不是整个 List 扔进去呢,因为看源码发现,因为我们业务是在同一个数据源里操作,所以只需要提交第一个即可,虽然 List 因为业务因素会添加很多,猜想里面数据源是引用对象,所以会自动处理相等对象的逻辑

Tip2:非常关键,updateTranSyncManager & transactionHandle 这 2 个方法必须保持一致性,怎么理解呢?就是 bindResource 后必须要执行 commit 或 rollback 方法,否则就会引起不一致性,导致上面的报错,要么就 2 个方法都不要执行,也是一种一致性

好了,精彩的故事正式开始......

有了上面的基础概念后,我们看这个 Redis 如果挂了的话,比如此时正好在业务处理的时候报错了呢?那么很有可能 DELETE 和 INSERT 操作没做完,导致事务 transactionStatusList 没有执行 add 操作,那么就会到 updateTranSyncManager 这方法里进行 bindResource,但是呢,等到进入 transactionHandle 方法里的时候,因为 List 是空的,所以不会执行 commit 或 rollback 操作,那么就会违背我们上面的规则(没有达成一致性),我们也称为事务管理器里的数据源混乱现象。

Ps:transactionStatusList 这个的入口是在执行 INSERT 或 UPDATE 或 INSERT 操作的时候,塞进去的每一次执行是一个事务

解决方案

很明显,因为上面 updateTranSyncManager 没有对 List 进行判空处理,导致不一致现象发生,修改完代码如下

java 复制代码
private void updateTranSyncManager(List<TransactionStatus> transactionStatusList) {
    if (!transactionStatusList.isEmpty()) {
        // err: No value for key [DynamicRoutingDataSource] bound to thread
        TransactionSynchronizationManager.bindResource(dynamicRoutingDataSource, dynamicRoutingDataSource);
        // err: Transaction synchronization is not active
        TransactionSynchronizationManager.initSynchronization();
    }
}
相关推荐
2501_9419820511 分钟前
深度对比:Java、Go、Python 实现企微外部群推送,哪个效率更高?
java·golang·企业微信
此生只爱蛋16 分钟前
【Redis】主从复制
数据库·redis
码字的字节26 分钟前
Spring Cloud服务注册与发现(一):手把手搭建Eureka Server,详解高可用配置
spring·spring cloud·eureka
大厂资深架构师29 分钟前
Spring Cloud Eureka在后端系统中的服务剔除策略
spring·spring cloud·ai·eureka
马猴烧酒.35 分钟前
【面试八股|JAVA多线程】JAVA多线程常考面试题详解
java·服务器·数据库
sino爱学习1 小时前
高性能线程池实践:Dubbo EagerThreadPool 设计与应用
java·后端
风生u2 小时前
activiti7 详解
java
岁岁种桃花儿2 小时前
SpringCloud从入门到上天:Nacos做微服务注册中心(二)
java·spring cloud·微服务
Word码2 小时前
[C++语法] 继承 (用法详解)
java·jvm·c++
TT哇2 小时前
【实习 】银行经理端两个核心功能的开发与修复(银行经理绑定逻辑修复和线下领取扫码功能开发)
java·vue.js