【Bug】【内存相关】偶然发现一个内存溢出Bug复盘

一、问题

跑自动化用例的时候,uat-sg环境,发现SGW经常会返回 502 Bad Gateway响应

二、原因

经过SRE和BE Dev共同排查,502 是从ALB-- > 后端服务 后端服务无法响应导致,ALB会直接给客户端返回502。

服务端:由于cgroup升级到v2,java无法正确识别内存配置(设置32G,实际物理内存只有16G),导致内存溢出,服务重启,一直没响应给ALB,所以返回502
检查实际启动参数内存分配

检查grafana CPU监控,发现有波动

检查grafana 内存监控,发现有用完情况

检查服务重启日志,有对应重启记录

三、解决办法

将Java启动参数-jar -XX:InitialRAMPercentage=80.0 -XX:MaxRAMPercentage=80.0 -XX:MinRAMPercentage=80.0

修改为:-jar -Xms12g -Xmx15g

四、效果

修改后,所有自动化未返回502

五、影响

live xx地区可能会有相同现象,发版解决

六、监控告警

思考:建立live环境服务器资源阈值告警体系,及时发现问题

相关推荐
wow_DG2 天前
【Python✨】VS Code 秒开 Python 类型检查:一招 mypy + settings.json 让你的 Bug 原地现形!
python·json·bug
驱动探索者4 天前
Zephyr 获取 cpu 占用率异常bug分析
bug·rtos·zephyr
薛定e的猫咪5 天前
【调试技巧】vscode 四种断点调试,快速定位 bug
ide·vscode·python·bug
万粉变现经纪人5 天前
如何解决 pip install 编译报错 ‘cl.exe’ not found(缺少 VS C++ 工具集)问题
开发语言·c++·人工智能·python·pycharm·bug·pip
月小满6 天前
DataV轮播时其他组件的内容也一起滚动 修复bug的方法
前端·vue.js·bug·大屏端
桃子丫7 天前
AD转 Cadence学习指南-BUG篇
bug
testtraveler7 天前
[Fix] ImportError: libtorch_cpu.so: undefined symbol: iJIT_NotifyEvent
pytorch·python·bug
测试者家园7 天前
从“找 bug”到“降风险”:测试思维模式的底层迁移
软件测试·bug·风险管理·持续测试·测试基础·智能化测试·测试思维模式
chde2Wang7 天前
运行scala文件报错xsbt.CompilerInterface
bug·scala
离离茶8 天前
【笔记1-8】Qt bug记录:QListWidget窗口的浏览模式切换为ListMode后,滚轮滚动速度变慢
笔记·qt·bug