记一次阿里云服务器java应用无法响应且无法远程连接的问题排查

问题表现

java服务无响应,无法远程链接到服务器。

今天中午12点多,应用直接崩溃。后续进入到服务器,发现java进程都不在了,

排查过程

先安装atop工具
安装、配置并使用atop监控工具

等下次再出现时看相关时间点日志,可以看到磁盘占用飙升。

使用journalctl查看内核日志

发现oom了,然后kill了应用,那应该时内存满了,内核自己杀了程序了。看下atop内存监控情况

可以看到是java程序和dnf程序把内存占满了。

问题根源

问题根源是内存不足导致的OOM

1、 正常状态下 java进程基本跑满了物理内存(显示为77% 实际内存需要部分空间用于数据交换和缓存)

2、 dnf是centos8 包管理器,该服务会定期拉去dnf包缓存,执行该任务时会消耗部分内存资源

3、 磁盘io跑满也是有内存不足导致的OOM所引起的

相关推荐
简单点了4 小时前
全栈编程基础知识7
运维·服务器·网络
眷蓝天4 小时前
Docker 镜像瘦身:从 GB 到 MB 的优化实践
运维·docker·容器
实心儿儿4 小时前
Linux —— 进程控制 - mini shell
linux·运维·服务器
OtIo TALL4 小时前
redis7 for windows的安装教程
java
程序员黄老师5 小时前
Windows文件移动到Linux上的坑
linux·运维·服务器
shizhan_cloud5 小时前
自动化部署Kubernetes集群
运维·kubernetes
mounter6255 小时前
【内核前沿】Linux IPC 迎来大变局?POSIX 消息队列增强、io_uring IPC 与 Bus1 十年回归
linux·运维·服务器·kernel·ipc·io_uring
uNke DEPH5 小时前
Spring Boot的项目结构
java·spring boot·后端
xixingzhe25 小时前
idea启动vue项目
java·vue.js·intellij-idea
wzl202612135 小时前
企业微信定时群发技术实现与实操指南(原生接口+工具落地)
java·运维·前端·企业微信