linux 下的java gate服务断掉的原因及解决思路

一.查询断掉的原因

1.查看gate日志,发现没有报错信息,突然就断了

2.查看是不是OOM导致

dmesg | grep java

发现确实Out of Memory了

3.发生问题的原因:

默认情况下, Linux kernels(内核)允许进程申请的量超过系统可用内存. 这是因为,在大多数情况下, 很多进程申请了很多内存, 但实际使用的量并没有那么多.

有个简单的类比, 宽带租赁的服务商, 可能他的总带宽只有 10Gbps, 但却卖出远远超过100份以上的 100Mbps 带宽, 原因是多数时候, 宽带用户之间是错峰的, 而且不可能每个用户都用满服务商所承诺的带宽。

4.解决思路

法1:保护我们重要的进程,避免被处理掉实例

1.获得重要进程的PID

复制代码
ps -ef|grep java

2.(输入-17,禁止被OOM机制处理)

复制代码
echo -17 > /proc/PID/oom_score_adj

法2:改变vm.overcommit_memory的参数

默认值为:0

从内核文档里得知,该参数有三个值,分别是:

0:当用户空间请求更多的的内存时,内核尝试估算出剩余可用的内存。

1:当设这个参数值为1时,内核允许超量使用内存直到用完为止,主要用于科学计算

2:当设这个参数值为2时,内核会使用一个决不过量使用内存的算法,即系统整个内存地址空间不能超过swap+50%的RAM值,50%参数的设定是在overcommit_ratio中设定。

默认是0,如果法1之后还崩,那就看情况选择1或者2

相关推荐
无限的鲜花7 小时前
反射(原创推荐)
java·开发语言
运维行者_7 小时前
企业无线网络监控的挑战与智能化演进趋势
大数据·运维·服务器·网络·数据库
IT二叔7 小时前
Java项目部署-03-teamcity-cicd-docker镜像流水线方式部署
java·ci/cd·持续部署
一路向北he8 小时前
字节钢铁军团--“提供情境,而非控制”
java·开发语言·前端
2603_955279708 小时前
Cursor + GitOps:自动化运维新姿势
运维·自动化
超级数据查看器8 小时前
超级数据查看器 v10.0 发布
java·大数据·数据库·sqlite·安卓
Waay8 小时前
面试口述版:个人对 Prometheus 完整理解
运维·学习·云原生·面试·职场和发展·kubernetes·prometheus
三8449 小时前
文件查找/文件压缩/解压缩
linux·运维·服务器
小猪写代码9 小时前
Linux 管道(Pipeline)作业
linux·运维·服务器
桌面运维家9 小时前
如何用半缓存云桌面将服务器硬盘容量扩展至本地终端?
运维·服务器·缓存