记一次阿里云服务器java应用无法响应且无法远程连接的问题排查

问题表现

java服务无响应,无法远程链接到服务器。

今天中午12点多,应用直接崩溃。后续进入到服务器,发现java进程都不在了,

排查过程

先安装atop工具
安装、配置并使用atop监控工具

等下次再出现时看相关时间点日志,可以看到磁盘占用飙升。

使用journalctl查看内核日志

发现oom了,然后kill了应用,那应该时内存满了,内核自己杀了程序了。看下atop内存监控情况

可以看到是java程序和dnf程序把内存占满了。

问题根源

问题根源是内存不足导致的OOM

1、 正常状态下 java进程基本跑满了物理内存(显示为77% 实际内存需要部分空间用于数据交换和缓存)

2、 dnf是centos8 包管理器,该服务会定期拉去dnf包缓存,执行该任务时会消耗部分内存资源

3、 磁盘io跑满也是有内存不足导致的OOM所引起的

相关推荐
小bo波8 小时前
使用Thread子类创建线程 VS 使用Runnable接口创建线程的区别
java·多线程·thread·并发编程·runnable
SamDeepThinking9 小时前
高并发场景下,CompletableFuture与ForkJoinPool该如何取舍?
java·后端·面试
张不才12 小时前
CPU 100% 了怎么办?Java 性能排障的标准化操作
java·后端
shepherd11113 小时前
吞吐量提升 10 倍:高并发大批量数据处理任务的架构演进与性能调优
java·后端·架构
荣--16 小时前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
plainGeekDev16 小时前
单例模式 → object 声明
android·java·kotlin
江华森16 小时前
动手实战学 Docker — 从零到集群编排完全指南
运维
用户2986985301417 小时前
Java 实现 Word 文档文本与图片提取的方法
java·后端
SimonKing18 小时前
铁子,IntelliJ IDEA 2026.1.3来了,升不升?
java·后端·程序员