背景
- Java引入显示锁以提升性能,但增加了编程复杂性。
- 必须显式调用
lock
和unlock
,确保锁的释放。 - 复杂场景下,锁的申请和释放可能不在同一个代码块,导致锁未释放,后续请求等待。
导致锁未释放的原因
- 代码异常处理不当,未能释放锁。
- 线程意外退出,如被外层终止。
解决方法
- 日志解法 :通过详细记录日志来追踪问题,但存在实施难度。
- 难度包括:编码人员是否按要求记录日志,多人协同时日志可能失效或误删。
锁的特征分析
- 以
ReentrantLock
为例,分析锁的状态和线程信息。 - 锁的状态位和线程信息(
exclusiveOwnerThread
)是关键。
heapdump解法
- 使用
jmap
命令生成heapdump文件。 - 使用MAT(Memory Analyzer Tool)解析heapdump。
- 利用MAT的OQL(Object Query Language)功能,筛选出被占用的锁对象。
OQL示例
select * from java.util.concurrent.locks.ReentrantLock$NonfairSync s where s.exclusiveOwnerThread != null
- 筛选条件:
exclusiveOwnerThread
字段不为null,找出当前被占用的锁。
线程堆栈信息
- heapdump包含线程堆栈信息,可通过MAT检索。
场景分析
- 线程未走到释放锁的代码,需要解决阻塞问题。
- 线程已走完锁代码,通过堆栈判断是否已执行。
- 线程已找不到,可能是正常退出或被执行了
stop
。
进一步分析
- 建议开启JFR(Java Flight Recorder),在问题发生时dump记录,以判断是否执行过
stop
函数。
小结
- 结合heapdump和JFR,即使在日志不足的情况下,也能找到未能正确释放锁的原因。