背景
本文清晰的记录一次线上卡顿的解决过程,1来作为记录,2来给其他人带来帮助。
现象描述
多位用户反馈,系统卡顿;
登录系统后验证,不分菜单进不去。偶现
时间线
|-------|------------------------------------|------------------------------------|-------------------------|
| 9:13 | 产品支持群,有人反馈系统慢 | | |
| 9:35 | 俊哥群里喊人,组内开发排查 | 主要是日志的error。大多集中在crpc超时、rabbitMQ异常 | |
| 10:19 | 长亮发现有OutOfMemoryError异常,决定重启32.9节点 | | 直接通过grafana看内存是否异常,可先重启 |
| 10:28 | 长亮重启完成,通知客户。且反馈正常 | | |
| 11:07 | 定位OOM代码位置,讨论后得知,大概率车型参数 | | |
| 11:21 | 长亮确认执行SQL,确实是车型参数为空。表568万 | t_detection_v2_picture_store | |
| 11:44 | 长亮修复代码并上线,10min后,上线完成 | | |
从单点反馈到开发介入:22分钟;
从开发介入到解决并确认:53分钟。
系统卡顿确认
确认系统和机器节点。

问题定位


📎java stack of catalina-exec-12.log
定位代码位置
at com.chaboshi.web.qa.controllers.detectionPicture.DetectionV2PictureStoreController.edit() (line: 92)
问题最终确认
全表查询,500W+。


问题解决

经验总结
避免大表,全表查询。
日志检索
appName:qa
callerIp:
class:com.rabbitmq.client.impl.ForgivingExceptionHandler
env:PRO
hostIp:172.21.32.9
hostName:172.21.32.9
level:ERROR
msg:An unexpected connection driver error occurred
pid:2897
spanId:
stackTrace:java.lang.OutOfMemoryError: Java heap space
thread:AMQP Connection 172.21.80.19:5672
timestamp:2026-04-16 09:10:32.693
traceId:
uriPath:
关键字:java.lang.OutOfMemoryError
