记一次阿里云服务器java应用无法响应且无法远程连接的问题排查

问题表现

java服务无响应,无法远程链接到服务器。

今天中午12点多,应用直接崩溃。后续进入到服务器,发现java进程都不在了,

排查过程

先安装atop工具
安装、配置并使用atop监控工具

等下次再出现时看相关时间点日志,可以看到磁盘占用飙升。

使用journalctl查看内核日志

发现oom了,然后kill了应用,那应该时内存满了,内核自己杀了程序了。看下atop内存监控情况

可以看到是java程序和dnf程序把内存占满了。

问题根源

问题根源是内存不足导致的OOM

1、 正常状态下 java进程基本跑满了物理内存(显示为77% 实际内存需要部分空间用于数据交换和缓存)

2、 dnf是centos8 包管理器,该服务会定期拉去dnf包缓存,执行该任务时会消耗部分内存资源

3、 磁盘io跑满也是有内存不足导致的OOM所引起的

相关推荐
lifallen30 分钟前
从Apache Doris 学习 HyperLogLog
java·大数据·数据仓库·算法·apache
fire-flyer30 分钟前
maven-jlink-plugin入门
java·maven
养生技术人30 分钟前
Oracle OCP认证考试题目详解082系列第49题
运维·数据库·sql·oracle·database·开闭原则·ocp
Knight_AL32 分钟前
Java 单元测试全攻略:JUnit 生命周期、覆盖率提升、自动化框架与 Mock 技术
java·junit·单元测试
cominglately37 分钟前
记录一次生产环境数据库死锁的处理过程
java·死锁
用户03321266636740 分钟前
在 Word 文档中插入图片的 Java 指南
java
深圳蔓延科技1 小时前
单点登录到底是什么?
java·后端
SimonKing1 小时前
除了 ${},Thymeleaf 的这些用法让你直呼内行
java·后端·程序员
wanhengidc1 小时前
云手机的挂机功能涉及到哪些内容
运维·服务器·网络·游戏·智能手机
科兴第一吴彦祖1 小时前
基于Spring Boot + Vue 3的乡村振兴综合服务平台
java·vue.js·人工智能·spring boot·推荐算法