问题背景
我有一个 Linux 服务器(192.168.1.255),上面部署了 PowerJob 和我的 Java 微服务。我的开发机是 Windows 系统(192.168.1.99)。当我把微服务部署到服务器的 Docker 中时,它能成功注册到 PowerJob,但在本地开发环境下却总是注册失败。
2025-12-13 12:37:20.910 WARN [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600620853, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1414, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0181, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.912 WARN [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600635862, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1466, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0187, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.918 WARN [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], message stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.919 WARN [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], control stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.921 WARN [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Quarantine of [akka://oms-server@192.168.1.225:10086] ignored because unknown UID. Reason: Outbound control stream restarted. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound control stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted
配置信息
Java 微服务连接 PowerJob 的配置如下:
powerjob:
worker:
akka-port: 42103
app-name: yu_bei_factory_prd_qualityCenter_job
server-address: 192.168.1.225:7700
store-strategy: disk
错误现象
本机运行时出现以下错误日志:
Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed.
错误日志显示,连接 PowerJob 的 10086 端口失败。但奇怪的是,我通过 telnet 192.168.1.225 10086测试发现端口是通的。
排查过程
第一阶段:初步排查
-
检查错误日志,发现一个关键信息:
workerAddress=172.23.64.1:42103这显示本机通过 42103 端口连接 PowerJob 时使用的 IP 是 172.23.64.1,而不是我期望的 192.168.1.99
-
检查本机网络配置:
发现本机有两个 IP 地址
以太网适配器 以太网:
IPv4 地址: 192.168.1.99以太网适配器 vEthernet (Default Switch):
IPv4 地址: 172.23.64.1
第二阶段:AI 建议尝试
我咨询了 AI,它给出了多种解决方案:
-
配置 Java 环境变量使用 IPv4
-
尝试各种 PowerJob 的 IP 相关配置
-
检查 PowerJob 服务的 10086 端口绑定情况
- 通过
netstat -tlnp | grep 10086确认端口已正确绑定在内网 IP 上
- 通过

但所有这些方案都没有解决问题。
第三阶段:源码级排查
今天我决定通过源码排查来解决这个问题:
-
定位报错代码位置
- 从错误信息
t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23]找到报错代码位置
- 从错误信息
-
设置断点调试
-
在对应位置设置断点
-
运行项目,当代码停在断点处时,通过调用栈逐步向上追踪
-
-
找到关键代码
- 最终找到了 PowerJob 获取 workerAddress 的地方:
String addressFromJVM = System.getProperty("powerjob.network.local.address");
解决方案
在运行代码前,配置 JVM 环境变量:
-Dpowerjob.network.local.address=192.168.1.99
重新运行项目,问题成功解决!

问题回顾
在解决本地开发机无法连接PowerJob服务器的过程中,我经历了从依赖AI到自主排查的完整过程。最终通过源码调试找到了问题根源,但这个过程中的体会远比技术解决方案本身更值得记录。
我的真实体悟
1. AI无法解决所有问题,尤其涉及版本差异时
-
配置兼容性问题:AI提供的许多PowerJob配置方案,在我的版本中并不支持
-
版本特定性:不同版本的PowerJob配置项存在差异,通用建议可能不适用
-
局限认知:AI难以了解我使用的具体版本和环境细节
2. 源码排查比想象中简单高效
-
精准定位:通过错误日志直接定位到具体代码位置
-
快速验证:在关键代码处设置断点,运行调试
-
直击核心 :迅速找到
System.getProperty("powerjob.network.local.address")这行关键代码
3. AI协助的价值在于前期铺垫
虽然最终是通过源码调试解决问题,但前期的AI协助并非徒劳:
-
排除可能性:AI建议帮助我过滤掉了许多常见问题
-
积累认知:通过尝试各种方案,加深了对问题边界的理解
-
聚焦方向:失败的经验让我明确了正确的排查方向