【Bug】【内存相关】偶然发现一个内存溢出Bug复盘

一、问题

跑自动化用例的时候,uat-sg环境,发现SGW经常会返回 502 Bad Gateway响应

二、原因

经过SRE和BE Dev共同排查,502 是从ALB-- > 后端服务 后端服务无法响应导致,ALB会直接给客户端返回502。

服务端:由于cgroup升级到v2,java无法正确识别内存配置(设置32G,实际物理内存只有16G),导致内存溢出,服务重启,一直没响应给ALB,所以返回502
检查实际启动参数内存分配

检查grafana CPU监控,发现有波动

检查grafana 内存监控,发现有用完情况

检查服务重启日志,有对应重启记录

三、解决办法

将Java启动参数-jar -XX:InitialRAMPercentage=80.0 -XX:MaxRAMPercentage=80.0 -XX:MinRAMPercentage=80.0

修改为:-jar -Xms12g -Xmx15g

四、效果

修改后,所有自动化未返回502

五、影响

live xx地区可能会有相同现象,发版解决

六、监控告警

思考:建立live环境服务器资源阈值告警体系,及时发现问题

相关推荐
随遇而安622&50820 小时前
分布式微服务项目,同一个controller方法间的转发导致cookie丢失,报错null pointer异常
分布式·微服务·架构·bug
三劫散仙3 天前
vue3 + naive ui card header 和 title 冲突 bug
ui·vue·bug
老汉忒cpp3 天前
测试概念以及测试bug
bug
Fan_web5 天前
Node.js——fs模块-相对路径的bug与解决
开发语言·前端·node.js·bug
送个祝福给小豪5 天前
这是一个bug求助帖子--安装kali 遇坑
bug·安装kali·kali bug·kali安装中文输入法·kali换源
嵌入式Linux,5 天前
BUG: scheduling while atomic
linux·运维·服务器·bug
会发光的猪。6 天前
【vue3若依框架切换菜单,跳转到其他页面会导致所有页面出现空白的情况,刷新页面后又恢复正常(只限于当前页面正常)】
前端·vue.js·bug
dj15402252037 天前
group_concat配置影响程序出bug
android·bug
布值倒区什么name7 天前
bug日常记录responded with a status of 413 (Request Entity Too Large)
运维·服务器·bug
码农派大星。7 天前
软件测试--BUG篇
功能测试·bug