【Bug】【内存相关】偶然发现一个内存溢出Bug复盘

一、问题

跑自动化用例的时候,uat-sg环境,发现SGW经常会返回 502 Bad Gateway响应

二、原因

经过SRE和BE Dev共同排查,502 是从ALB-- > 后端服务 后端服务无法响应导致,ALB会直接给客户端返回502。

服务端:由于cgroup升级到v2,java无法正确识别内存配置(设置32G,实际物理内存只有16G),导致内存溢出,服务重启,一直没响应给ALB,所以返回502
检查实际启动参数内存分配

检查grafana CPU监控,发现有波动

检查grafana 内存监控,发现有用完情况

检查服务重启日志,有对应重启记录

三、解决办法

将Java启动参数-jar -XX:InitialRAMPercentage=80.0 -XX:MaxRAMPercentage=80.0 -XX:MinRAMPercentage=80.0

修改为:-jar -Xms12g -Xmx15g

四、效果

修改后,所有自动化未返回502

五、影响

live xx地区可能会有相同现象,发版解决

六、监控告警

思考:建立live环境服务器资源阈值告警体系,及时发现问题

相关推荐
qq_544329174 天前
CRM项目的开发与调试整体策略
前端·后端·bug
程序员小寒8 天前
由于请求的竞态问题,前端仔喜提了一个bug
前端·javascript·bug
Golinie8 天前
记一次Linux共享内存段排除Bug:key值为0x0000000的共享内存段删除不了
linux·bug·共享内存段
谢尔登9 天前
【Bug 记录】el-sub-menu 第一次进入默认不高亮
bug
qq_5443291710 天前
下载一个项目到跑通的大致过程是什么?
javascript·学习·bug
Algorithm-00711 天前
软件测试入门—软件缺陷 Bug 详解
软件测试·bug
从int开始12 天前
加速排查线上bug
bug
LilySesy12 天前
【业务案例】F.13——SAP系统标准的清帐程序有BUG?
运维·bug·sap·abap·esb·internet服务
guhy fighting12 天前
原生toFixed的bug
前端·javascript·bug