记一次阿里云服务器java应用无法响应且无法远程连接的问题排查

问题表现

java服务无响应,无法远程链接到服务器。

今天中午12点多,应用直接崩溃。后续进入到服务器,发现java进程都不在了,

排查过程

先安装atop工具
安装、配置并使用atop监控工具

等下次再出现时看相关时间点日志,可以看到磁盘占用飙升。

使用journalctl查看内核日志

发现oom了,然后kill了应用,那应该时内存满了,内核自己杀了程序了。看下atop内存监控情况

可以看到是java程序和dnf程序把内存占满了。

问题根源

问题根源是内存不足导致的OOM

1、 正常状态下 java进程基本跑满了物理内存(显示为77% 实际内存需要部分空间用于数据交换和缓存)

2、 dnf是centos8 包管理器,该服务会定期拉去dnf包缓存,执行该任务时会消耗部分内存资源

3、 磁盘io跑满也是有内存不足导致的OOM所引起的

相关推荐
傲世(C/C++,Linux)几秒前
Linux系统编程——exec函数族
linux·服务器
代码栈上的思考10 分钟前
JVM中内存管理的策略
java·jvm
盈创力和200717 分钟前
物联网 “神经” 之以太网:温湿度传感器的工业级 “高速干道”
运维·服务器·网络·嵌入式硬件·以太网温湿度传感器
eddy-原23 分钟前
阿里云核心服务解析与应用实践
linux·运维·阿里云·云计算
YoungP25 分钟前
【Effective Java 条目二】-- 当构造器参数较多时考虑使用生成器
java
路由侠内网穿透.26 分钟前
外网访问可视化工具 Grafana (Linux版本)
linux·运维·服务器·grafana·远程工作
爱吃糖的小秦同学32 分钟前
Docker爆红且安装非C盘处理方案
运维·docker·容器
睿本云40 分钟前
产品月报|睿本云10月产品功能迭代
运维·服务器·apache
野生技术架构师42 分钟前
牛客网Java 高频面试题总结(2025最新版)
java·开发语言·面试
纪莫1 小时前
技术面:SpringBoot(springboot的类加载和传统的双亲委派有什么区别、如何按顺序实例化Bean)
java·spring·java面试⑧股