【Bug】【内存相关】偶然发现一个内存溢出Bug复盘

一、问题

跑自动化用例的时候,uat-sg环境,发现SGW经常会返回 502 Bad Gateway响应

二、原因

经过SRE和BE Dev共同排查,502 是从ALB-- > 后端服务 后端服务无法响应导致,ALB会直接给客户端返回502。

服务端:由于cgroup升级到v2,java无法正确识别内存配置(设置32G,实际物理内存只有16G),导致内存溢出,服务重启,一直没响应给ALB,所以返回502
检查实际启动参数内存分配

检查grafana CPU监控,发现有波动

检查grafana 内存监控,发现有用完情况

检查服务重启日志,有对应重启记录

三、解决办法

将Java启动参数-jar -XX:InitialRAMPercentage=80.0 -XX:MaxRAMPercentage=80.0 -XX:MinRAMPercentage=80.0

修改为:-jar -Xms12g -Xmx15g

四、效果

修改后,所有自动化未返回502

五、影响

live xx地区可能会有相同现象,发版解决

六、监控告警

思考:建立live环境服务器资源阈值告警体系,及时发现问题

相关推荐
ALGO阿狗4 天前
SimpleDateFormat(“YYYY-MM-dd“)格式化时间出现了bug?
bug
爱学习的小可爱卢5 天前
JavaSE基础-Java异常体系:Bug定位终极指南
java·bug·javase
GeekyGuru5 天前
代码诊疗室——疑难Bug破解战
bug
嵌入式×边缘AI:打怪升级日志8 天前
9.2.3 UART 驱动严重 Bug(保姆级讲解)
bug
qq_242188633210 天前
代码诊疗室——疑难Bug破解战
bug
Moshow郑锴12 天前
Java SpringBoot 疑难 Bug 排查思路解析:从“语法正确”到“行为相符”
java·spring boot·bug
人间花海12 天前
BUG终结者:挑战你的调试极限
bug
2401_8582861112 天前
OS54.【Linux】System V 共享内存(3) “共享内存+管道“修bug记录
linux·运维·服务器·算法·bug
Kurbaneli13 天前
代码诊疗室——疑难Bug破解战
bug
Mr -老鬼15 天前
从 0 到 1 落地:Rust + Salvo 实现用户系统与 Bug 管理系统
开发语言·rust·bug