高并发下 MySQL Statement Cancellation Timer 的线程数暴涨

问题描述

在线上环境,出现高并发的场景下,MySQL Statement Cancellation Timer 的线程数比较多,接收到线上预警,分析一下原因。

下图为本地模拟环境,配置比较低,问题不突出,主要是示意一下。😏😏😏

以下是 mysql 驱动,连接池,orm 框架信息

依赖信息:

  1. mysql-jdbc 8.0.24
  2. druid 1.2.8
  3. mybatis 3.4.6

环境配置信息

  1. druid 配置,全部都是默认值
  2. mybatis 配置:
scss 复制代码
@Bean
public SqlSessionFactory sqlSessionFactory(DataSource dataSource) throws Exception {
    SqlSessionFactoryBean factory = new SqlSessionFactoryBean();
    factory.setVfs(SpringBootVFS.class);
    factory.setDataSource(dataSource);
    //todo 省略其他配置
    Configuration c = new Configuration();
    c.setLogImpl(StdOutImpl.class);
    c.setDefaultStatementTimeout(25000);
    factory.setConfiguration(c);

    return factory.getObject();
}

产生该线程分析

  1. 找到该线程的创建的地方 NativeSession
  1. 引用关系如下
  1. 什么时候启动 enableQueryTimeouts = true
  1. 默认值是 true
  1. startQueryTime 的调用方 StatementImpl 的 executeQuery
  1. 可以发现 timeOutInMillis 不为 0 的情况下,并且 enableQueryTimeouts = true 就会创建 CanalQueryTask 然后如果超时就会自动调度

方法调用如下: com.mysql.cj.CancelQueryTaskImpl#run

处理方案

  1. 项目使用的是使用 alibaba druid

参考:github.com/alibaba/dru...

调用的是 setQueryTimeOut 方法,然后传给 timeOutInMills

如果需要取消 CancelQueryTask 需要将 validationQueryTimeout 设置为 0

2. 并且去掉 mybatis defalutStatemnetTimeOut 参数

  1. 这些都去掉了这么来处理 mysql collection timeout
  • mysql 服务器会有一个参数 wait_timeout:mysql server 关闭连接之前,允许连接闲置多少秒。默认是 28800,单位秒,即 8 个小时。
sql 复制代码
    # 分别查看全局、会话变量值
    show global VARIABLES like '%timeout%';
    show  VARIABLES like '%timeout%';
  • druid 可以通过 testOnBorrow 和 testOnReturn、testWhileIdle分别在链接获取,链接归还的时候判断是否有效。

复现和修复

测试代码

修复效果

现象 MySQL Statement Cancellation Timer 的线程不在产生

thread dump 分析工具地址:fastthread.io/

参考资料

相关推荐
前端小张同学17 分钟前
一次支付回调引发的「血案」:我是如何用 Redis + AOP 实现接口幂等的
后端
孟沐1 小时前
Java IO 流 - FileOutputStream & ObjectOutputStream 大白话解析
后端
lichenyang4531 小时前
Node.js文件上传原理
后端
Java水解2 小时前
微服务架构下Spring Session与Redis分布式会话实战全解析
后端·spring
Moe4882 小时前
如何使用 Spring Cache 结合 Redis 和 Caffeine 构建二级缓存机制
后端
Json_Lee2 小时前
2026 年了,多 Agent 编码该怎么选?agent-team vs Claude Agent Teams vs Claude Squad vs Met
前端·后端·vibecoding
陈随易2 小时前
刚上市就断货?如此火爆的编程显示器到底有什么魔力
前端·后端·程序员
ray_liang3 小时前
一小时手搓轻量级可代替 Qdrant 的向量数据库
后端·架构
后端AI实验室3 小时前
我把一个生产Bug的排查过程,交给AI处理——20分钟后我关掉了它
java·ai
昵称为空C3 小时前
spring-ai mcp-server(ssh工具)
后端·ai编程