解决本地 Windows 开发机无法注册到 PowerJob 服务器的问题

问题背景

我有一个 Linux 服务器(192.168.1.255),上面部署了 PowerJob 和我的 Java 微服务。我的开发机是 Windows 系统(192.168.1.99)。当我把微服务部署到服务器的 Docker 中时,它能成功注册到 PowerJob,但在本地开发环境下却总是注册失败。

复制代码
2025-12-13 12:37:20.910 WARN  [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600620853, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1414, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0181, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.912 WARN  [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600635862, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1466, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0187, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.918 WARN  [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], message stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.919 WARN  [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], control stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.921 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Quarantine of [akka://oms-server@192.168.1.225:10086] ignored because unknown UID. Reason: Outbound control stream restarted. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound control stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted

配置信息

Java 微服务连接 PowerJob 的配置如下:

复制代码
powerjob:
  worker:
    akka-port: 42103
    app-name: yu_bei_factory_prd_qualityCenter_job
    server-address: 192.168.1.225:7700
    store-strategy: disk

错误现象

本机运行时出现以下错误日志:

复制代码
Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed.

错误日志显示,连接 PowerJob 的 10086 端口失败。但奇怪的是,我通过 telnet 192.168.1.225 10086测试发现端口是通的。

排查过程

第一阶段:初步排查

  1. 检查错误日志,发现一个关键信息:workerAddress=172.23.64.1:42103

    这显示本机通过 42103 端口连接 PowerJob 时使用的 IP 是 172.23.64.1,而不是我期望的 192.168.1.99

  2. 检查本机网络配置:

    发现本机有两个 IP 地址

    以太网适配器 以太网:
    IPv4 地址: 192.168.1.99

    以太网适配器 vEthernet (Default Switch):
    IPv4 地址: 172.23.64.1

第二阶段:AI 建议尝试

我咨询了 AI,它给出了多种解决方案:

  1. 配置 Java 环境变量使用 IPv4

  2. 尝试各种 PowerJob 的 IP 相关配置

  3. 检查 PowerJob 服务的 10086 端口绑定情况

    • 通过 netstat -tlnp | grep 10086确认端口已正确绑定在内网 IP 上

但所有这些方案都没有解决问题。

第三阶段:源码级排查

今天我决定通过源码排查来解决这个问题:

  1. 定位报错代码位置

    • 从错误信息 t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23]找到报错代码位置
  2. 设置断点调试

    • 在对应位置设置断点

    • 运行项目,当代码停在断点处时,通过调用栈逐步向上追踪

  3. 找到关键代码

    • 最终找到了 PowerJob 获取 workerAddress 的地方:

    String addressFromJVM = System.getProperty("powerjob.network.local.address");

解决方案

在运行代码前,配置 JVM 环境变量:

复制代码
-Dpowerjob.network.local.address=192.168.1.99

重新运行项目,问题成功解决!

问题回顾

在解决本地开发机无法连接PowerJob服务器的过程中,我经历了从依赖AI到自主排查的完整过程。最终通过源码调试找到了问题根源,但这个过程中的体会远比技术解决方案本身更值得记录。

我的真实体悟

1. AI无法解决所有问题,尤其涉及版本差异时

  • 配置兼容性问题:AI提供的许多PowerJob配置方案,在我的版本中并不支持

  • 版本特定性:不同版本的PowerJob配置项存在差异,通用建议可能不适用

  • 局限认知:AI难以了解我使用的具体版本和环境细节

2. 源码排查比想象中简单高效

  • 精准定位:通过错误日志直接定位到具体代码位置

  • 快速验证:在关键代码处设置断点,运行调试

  • 直击核心 :迅速找到System.getProperty("powerjob.network.local.address")这行关键代码

3. AI协助的价值在于前期铺垫

虽然最终是通过源码调试解决问题,但前期的AI协助并非徒劳:

  • 排除可能性:AI建议帮助我过滤掉了许多常见问题

  • 积累认知:通过尝试各种方案,加深了对问题边界的理解

  • 聚焦方向:失败的经验让我明确了正确的排查方向

相关推荐
毕设源码-朱学姐3 小时前
【开题答辩全过程】以 工厂能耗分析平台的设计与实现为例,包含答辩的问题和答案
java·vue.js
Spring AI学习5 小时前
Spring AI深度解析(9/50):可观测性与监控体系实战
java·人工智能·spring
java1234_小锋6 小时前
Spring IoC的实现机制是什么?
java·后端·spring
xqqxqxxq6 小时前
背单词软件技术笔记(V2.0扩展版)
java·笔记·python
消失的旧时光-19436 小时前
深入理解 Java 线程池(二):ThreadPoolExecutor 执行流程 + 运行状态 + ctl 原理全解析
java·开发语言
哈哈老师啊6 小时前
Springboot学生综合测评系统hxtne(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
java·数据库·spring boot
4311媒体网6 小时前
帝国cms调用文章内容 二开基本操作
java·开发语言·php
zwxu_7 小时前
Nginx NIO对比Java NIO
java·nginx·nio
可观测性用观测云8 小时前
Pyroscope Java 接入最佳实践
java
气π9 小时前
【JavaWeb】——(若依 + AI)-基础学习笔记
java·spring boot·笔记·学习·java-ee·mybatis·ruoyi