一次线上事故的复盘
如果你把微服务比作一座 24 小时营业的快餐店,那 Spring Cloud Gateway 就是那位永远微笑服务、拿着麦克风接单的"金牌店员"。可就在某个不经意的瞬间,这位金牌店员居然因"低血糖"晕倒了!发生了什么呢?数据上传失败,顾客收到 500 错误 ,而后厨的 Gateway 因为内存不足而"断电"了。
今天,复盘下这段惊心动魄的"店员晕倒"过程,顺便确保网关不再"饿晕"。
第一幕:顾客大喊"奶茶洒了!"
时间线: 2025-08-22 09:18:54
主角: 客户端(拿着手机点单的顾客)
台词:
"老板!数据上传失败!就给我个 500?"
观众视角:
顾客懵了,不知道后台发生了什么,只见自己点的"数据上传"被一杯 500 错误奶茶 蓋过,显然是出了点问题。
第二幕:大堂经理 Nginx 的"对讲机"
时间线: 2025-08-22 01:27:06
主角: Nginx(大堂经理,手里攥着对讲机)
对讲机里传来:
"upstream prematurely closed connection while reading response header from upstream"
翻译成人话:
"后厨的小哥(Gateway)突然把传菜窗口关了,菜单都没递上来!"
Nginx 尴尬地对顾客喊道:
"502 Bad Gateway,请稍等,后厨出问题了。"
第三幕:后厨小哥 Gateway 的"低血糖"
时间线: 2025-08-22 10:22:44
主角: Gateway(Netty 版小哥)
后台监控大屏疯狂弹窗:
vbnet
reactor.netty.ReactorNetty$InternalNettyException:
OutOfDirectMemoryError: failed to allocate 4194304 byte(s) ...
小哥的内心 OS:
"我不是不想干活,实在是饿得眼前一黑------直接内存只剩 4M 了!"
于是小哥在承受不了内存饥饿的情况下,优雅地晕倒,顺便把传菜窗口"砰"地一声关了。
第四幕:急诊室抢救 3 连招
1. 打点滴------加直接内存
医生(运维) 迅速往小哥手臂上插上 -XX:MaxDirectMemorySize=2g
的大号葡萄糖液。
立刻回血 2 GB,小哥神清气爽,脸色红润!
2. 转 VIP 病房------扩容容器
K8s 护士 快速把小哥从 1.5 GB 的标间推到 4 GB 的豪华套房:
yaml
resources:
requests:
memory: "2Gi"
limits:
memory: "4Gi"
3. 调整食谱------优化 Netty 内存池
营养师 给小哥换上"中杯椰果",减少内存碎片,从此不再胀气、不反胃。小哥从此活力满满!
彩蛋:一张图看懂"晕倒"全过程

片尾曲:给未来的你 3 句忠告
- 直接内存不是无底洞 ,
-XX:MaxDirectMemorySize
该加就加,别省。 - 容器限额别抠门,流量洪峰来了,1 GB 的容器只能让小哥现场社死。
- 监控、监控、还是监控------把 Grafana 的仪表盘当心率仪,提前发现低血糖,小哥再也不会晕倒在柜台!
------END------
希望这篇技术博客能让你在解决 Spring Cloud Gateway 内存不足问题时,既能解决问题,又能带来一点乐趣!