【Bug】【内存相关】偶然发现一个内存溢出Bug复盘

一、问题

跑自动化用例的时候,uat-sg环境,发现SGW经常会返回 502 Bad Gateway响应

二、原因

经过SRE和BE Dev共同排查,502 是从ALB-- > 后端服务 后端服务无法响应导致,ALB会直接给客户端返回502。

服务端:由于cgroup升级到v2,java无法正确识别内存配置(设置32G,实际物理内存只有16G),导致内存溢出,服务重启,一直没响应给ALB,所以返回502
检查实际启动参数内存分配

检查grafana CPU监控,发现有波动

检查grafana 内存监控,发现有用完情况

检查服务重启日志,有对应重启记录

三、解决办法

将Java启动参数-jar -XX:InitialRAMPercentage=80.0 -XX:MaxRAMPercentage=80.0 -XX:MinRAMPercentage=80.0

修改为:-jar -Xms12g -Xmx15g

四、效果

修改后,所有自动化未返回502

五、影响

live xx地区可能会有相同现象,发版解决

六、监控告警

思考:建立live环境服务器资源阈值告警体系,及时发现问题

相关推荐
爱编程的鱼2 天前
想学编程作为今后的工作技能,学哪种语言适用性更强?
开发语言·算法·c#·bug
拽着尾巴的鱼儿2 天前
fixed-bug:JPA 关联关系的对象序列化循环引用问题
spring·bug·jpa
南汐以墨2 天前
BUG与测试用例
测试用例·bug
Mr. zhihao3 天前
Java 反序列化中的 boolean vs Boolean 陷阱:一个真实的 Bug 修复案例
java·bug·lua
初圣魔门首席弟子3 天前
vscode多文件编程bug记录
java·vscode·bug
-雷阵雨-4 天前
软件测试全解析:Bug生命周期与争议解决
bug
南林yan4 天前
Bug: 升级内核后有线网络无法使用
bug
月巴月巴白勺合鸟月半4 天前
一个DevExpress的Docx文件处理的Bug的解决
c#·bug
ao_lang4 天前
软件测试-BUG篇
bug
技术小黑屋_4 天前
Vibe Coding 真正的问题并不是 Bug
bug