java项目假死问题排查

项目问题

最近在开发一个监听服务的应用,需要用多个线程去获取服务提供方提供的消息,这个服务部署四天后就开始假死了,项目进程还在,但是没有日志输出。

问题排查

  1. 首先先排查服务器的各种资源,发现这些都正常。

free -h 查看服务器的内存

df -h 查看服务器的存储空间

top -H 查看cpu占用

  1. 排查网络状态,发现也正常 netstat -anp | grep <pid> 是否存在大量等待的网络请求

  2. 这些都没问题的话,那就需要去看下jvm的信息了

jstat -gcutil <pid> 1000 10 jstat 是 JDK 自带的强大工具,用于监控 JVM 内存使用和垃圾回收情况。检查发现老年代已经达到了100%。

到此问题已经很明确了,

复制代码
  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT  
0.00  99.86  99.99 100.00  94.87  92.54    992    0.289 235943 28620.620 28620.910
  1. ​老年代(O)持续100%​​:

    • 老年代空间完全耗尽
    • JVM 无法分配任何新对象到老年代
    • 导致所有内存请求失败
  2. ​年轻代完全阻塞​​:

    • Eden区(E)持续99.99%满
    • Survivor区(S1)持续99.86%
    • Young GC(YGC=992)完全停滞(连续多次无变化)
    • 对象晋升机制完全失效

问题解决

定位到问题后,就需要排查解决了 jmap -dump:format=b,file=heapdump.hprof <PID> 通过jmap将堆栈信息导出来,并通过​​Eclipse MAT​来进行分析(比较建议使用这个工具),他会告诉你xx实例占用了xxxxbyte,通过这个提示直接去排查相应的代码逻辑即可。

最后发现项目连接服务提供方获取消息失败三次后,连接会自动断开,每次断开重连都会创建新的连接对象,而旧的连接对象虽然做了关闭处理,但是可能仍在活跃,导致gc无法进行回收,连续多天创建对象导致老年代打满。

相关推荐
初学小白...1 小时前
线程同步机制及三大不安全案例
java·开发语言·jvm
凤山老林4 小时前
还在用JDK8?JDK8升级JDK11:一次价值千万的升级指南
java·开发语言·jvm·spring boot·后端·jdk
2501_938790074 小时前
详解 JVM 中的对象创建过程:类加载检查、内存分配、初始化的完整流程
jvm
宸津-代码粉碎机5 小时前
Java内部类内存泄露深度解析:原理、场景与根治方案(附GC引用链分析)
java·开发语言·jvm·人工智能·python
杨筱毅5 小时前
【底层机制】Android GC -- 为什么要有GC?GC的核心原理?理解GC的意义
android·jvm·gc
東雪木6 小时前
Java基础语言进阶学习——1,JVM内存模型(堆、栈、方法区)
java·jvm·学习
小满、13 小时前
JVM 执行引擎:字节码是如何被执行的
jvm·字节码·jvm执行引擎
无敌最俊朗@1 天前
SQLite 约束 (Constraints) 面试核心知识点
java·开发语言·jvm
milanyangbo1 天前
谁生?谁死?从引用计数到可达性分析,洞悉GC的决策逻辑
java·服务器·开发语言·jvm·后端·算法·架构
m0_748231311 天前
深入JVM:让Java性能起飞的核心原理与优化策略
java·开发语言·jvm