【案例60】NIO导致本地内存溢出

问题 现象

集成环境出现宕机,javacore中报本地内存溢出。

问题分析

对JAVACORE进行分析之后可以发现,有大量的异步IO线程。

同时查看websphere的ffdc事件可以发现:

从FFDC中可以看到部分信息:

java 复制代码
com.ibm.ws.util.ThreadPool$Worker.run(ThreadPool.java:1814)
Caused by: java.io.IOException: Async IO operation failed (1), reason: RC: 10053  您的主机中的软件中止了一个已建立的连接。
[22-14-24 12:12:41:315 GMT+08:00]     FFDC Exception:java.io.IOException SourceId:com.ibm.ws.webcontainer.channel.WCCByteBufferInputStream ProbeId:102 Reporter:com.ibm.ws.webcontainer.channel.WCCByteBufferInputStream@93528999
java.io.IOException: Async IO operation failed (1), reason: RC: 55  指定的网络资源或设备不再可用。

同时可以发现WAS的system.out中的报错

java 复制代码
[22-14-24 12:10:32:018 GMT+08:00] 000001a7 ECPCacheRemov I com.yonyou.ec.cache.command.ECPCacheRemoveCommand run ###UAPEC-ECPCacheRemoveCommand###移除SaleOrgName数据缓存对象,UserID:0001E310000000008FGZ
[22-14-24 12:10:33:097 GMT+08:00] 00001082 ActorClientAg E nc.web.es.uapecpub.server.support.ActorClientAgent$1 notifyStopped IP地址为127.0.0.1,端口为9011的远程机器失去连接.

有一个BOSS线程和大量worker。以16*2的速度增长。

经过和研发沟通定位,可以发现是EC那边采取了NETTY框架进行NIO的封装。

解决方案

正常来说,即使连接断开,NETTY也可以根据自己的心跳机制去断开连接。这里可以理解为一个BUG。

修改方案分为三种:

1.升级现有的NETTY框架。

2.修改默认线程数,时间上限等。

3.修改代码,增加判断。

java 复制代码
for (int i = 0; i < ports.length; ++i)
      if ((isLocal) || (isWebLocalDeploy(hosts[i], ports[i])))
        command.run();
      else
        try {
          new Socket(hosts[i], Integer.valueOf(ports[i]).intValue());
          getClientAgent(hosts[i], ports[i], comPorts[i]).sendCommandOneWay(command);
        } catch (Exception e) {
          Logger.error("网络ip或端口错误!ip:" + hosts[i] + ";port:" + ports[i]);

修改之后可以发现:

错误的端口配置下,NIO相关线程基本为0

正确的端口配置下,NIO的相关线程数为4-6个左右。

相关推荐
xrui585 小时前
2026实战:深度解析 Gemini 3.1 镜像站函数调用在自动化运维工单中的应用
linux·服务器·网络
HackTwoHub5 小时前
Linux 内核史诗级本地提权 全网深度复现、原理完整分析( CVE-2026-31431)
linux·运维·安全·web安全·网络安全·代码审计·安全架构
苍煜5 小时前
慢SQL优化实战教学
java·数据库·sql
AI进化营-智能译站5 小时前
ROS2 C++开发系列16-智能指针管理传感器句柄|告别ROS2节点内存泄漏与野指针
java·c++·算法·ai
chao1898445 小时前
完整MES系统实现 (C# 客户端服务器)
服务器·windows·c#
她说彩礼65万5 小时前
C语言 文件
linux·服务器·c语言
txg6665 小时前
自动驾驶领域热点简报(2026-04-26 ~ 2026-05-03)
linux·人工智能·自动驾驶
TeDi TIVE6 小时前
springboot和springframework版本依赖关系
java·spring boot·后端
二哈赛车手6 小时前
新人笔记---ES和kibana启动问题以及一些常用的linux的错误排查方法,以及ES,数据库泄密解决方案[超详细]
java·linux·数据库·spring boot·笔记·elasticsearch
嵌入式×边缘AI:打怪升级日志6 小时前
嵌入式Linux开发核心自测题(全系列精华浓缩)
java·linux·运维