【案例60】NIO导致本地内存溢出

问题 现象

集成环境出现宕机,javacore中报本地内存溢出。

问题分析

对JAVACORE进行分析之后可以发现,有大量的异步IO线程。

同时查看websphere的ffdc事件可以发现:

从FFDC中可以看到部分信息:

java 复制代码
com.ibm.ws.util.ThreadPool$Worker.run(ThreadPool.java:1814)
Caused by: java.io.IOException: Async IO operation failed (1), reason: RC: 10053  您的主机中的软件中止了一个已建立的连接。
[22-14-24 12:12:41:315 GMT+08:00]     FFDC Exception:java.io.IOException SourceId:com.ibm.ws.webcontainer.channel.WCCByteBufferInputStream ProbeId:102 Reporter:com.ibm.ws.webcontainer.channel.WCCByteBufferInputStream@93528999
java.io.IOException: Async IO operation failed (1), reason: RC: 55  指定的网络资源或设备不再可用。

同时可以发现WAS的system.out中的报错

java 复制代码
[22-14-24 12:10:32:018 GMT+08:00] 000001a7 ECPCacheRemov I com.yonyou.ec.cache.command.ECPCacheRemoveCommand run ###UAPEC-ECPCacheRemoveCommand###移除SaleOrgName数据缓存对象,UserID:0001E310000000008FGZ
[22-14-24 12:10:33:097 GMT+08:00] 00001082 ActorClientAg E nc.web.es.uapecpub.server.support.ActorClientAgent$1 notifyStopped IP地址为127.0.0.1,端口为9011的远程机器失去连接.

有一个BOSS线程和大量worker。以16*2的速度增长。

经过和研发沟通定位,可以发现是EC那边采取了NETTY框架进行NIO的封装。

解决方案

正常来说,即使连接断开,NETTY也可以根据自己的心跳机制去断开连接。这里可以理解为一个BUG。

修改方案分为三种:

1.升级现有的NETTY框架。

2.修改默认线程数,时间上限等。

3.修改代码,增加判断。

java 复制代码
for (int i = 0; i < ports.length; ++i)
      if ((isLocal) || (isWebLocalDeploy(hosts[i], ports[i])))
        command.run();
      else
        try {
          new Socket(hosts[i], Integer.valueOf(ports[i]).intValue());
          getClientAgent(hosts[i], ports[i], comPorts[i]).sendCommandOneWay(command);
        } catch (Exception e) {
          Logger.error("网络ip或端口错误!ip:" + hosts[i] + ";port:" + ports[i]);

修改之后可以发现:

错误的端口配置下,NIO相关线程基本为0

正确的端口配置下,NIO的相关线程数为4-6个左右。

相关推荐
lifallen5 分钟前
从Apache Doris 学习 HyperLogLog
java·大数据·数据仓库·算法·apache
fire-flyer5 分钟前
maven-jlink-plugin入门
java·maven
Knight_AL8 分钟前
Java 单元测试全攻略:JUnit 生命周期、覆盖率提升、自动化框架与 Mock 技术
java·junit·单元测试
cominglately12 分钟前
记录一次生产环境数据库死锁的处理过程
java·死锁
用户03321266636716 分钟前
在 Word 文档中插入图片的 Java 指南
java
深圳蔓延科技23 分钟前
单点登录到底是什么?
java·后端
SimonKing24 分钟前
除了 ${},Thymeleaf 的这些用法让你直呼内行
java·后端·程序员
wanhengidc43 分钟前
云手机的挂机功能涉及到哪些内容
运维·服务器·网络·游戏·智能手机
科兴第一吴彦祖44 分钟前
基于Spring Boot + Vue 3的乡村振兴综合服务平台
java·vue.js·人工智能·spring boot·推荐算法
ajassi20001 小时前
开源 java android app 开发(十八)最新编译器Android Studio 2025.1.3.7
android·java·开源