解决本地 Windows 开发机无法注册到 PowerJob 服务器的问题

问题背景

我有一个 Linux 服务器(192.168.1.255),上面部署了 PowerJob 和我的 Java 微服务。我的开发机是 Windows 系统(192.168.1.99)。当我把微服务部署到服务器的 Docker 中时,它能成功注册到 PowerJob,但在本地开发环境下却总是注册失败。

复制代码
2025-12-13 12:37:20.910 WARN  [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600620853, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1414, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0181, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.912 WARN  [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600635862, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1466, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0187, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.918 WARN  [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], message stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.919 WARN  [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], control stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.921 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Quarantine of [akka://oms-server@192.168.1.225:10086] ignored because unknown UID. Reason: Outbound control stream restarted. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound control stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted

配置信息

Java 微服务连接 PowerJob 的配置如下:

复制代码
powerjob:
  worker:
    akka-port: 42103
    app-name: yu_bei_factory_prd_qualityCenter_job
    server-address: 192.168.1.225:7700
    store-strategy: disk

错误现象

本机运行时出现以下错误日志:

复制代码
Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed.

错误日志显示,连接 PowerJob 的 10086 端口失败。但奇怪的是,我通过 telnet 192.168.1.225 10086测试发现端口是通的。

排查过程

第一阶段:初步排查

  1. 检查错误日志,发现一个关键信息:workerAddress=172.23.64.1:42103

    这显示本机通过 42103 端口连接 PowerJob 时使用的 IP 是 172.23.64.1,而不是我期望的 192.168.1.99

  2. 检查本机网络配置:

    发现本机有两个 IP 地址

    以太网适配器 以太网:
    IPv4 地址: 192.168.1.99

    以太网适配器 vEthernet (Default Switch):
    IPv4 地址: 172.23.64.1

第二阶段:AI 建议尝试

我咨询了 AI,它给出了多种解决方案:

  1. 配置 Java 环境变量使用 IPv4

  2. 尝试各种 PowerJob 的 IP 相关配置

  3. 检查 PowerJob 服务的 10086 端口绑定情况

    • 通过 netstat -tlnp | grep 10086确认端口已正确绑定在内网 IP 上

但所有这些方案都没有解决问题。

第三阶段:源码级排查

今天我决定通过源码排查来解决这个问题:

  1. 定位报错代码位置

    • 从错误信息 t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23]找到报错代码位置
  2. 设置断点调试

    • 在对应位置设置断点

    • 运行项目,当代码停在断点处时,通过调用栈逐步向上追踪

  3. 找到关键代码

    • 最终找到了 PowerJob 获取 workerAddress 的地方:

    String addressFromJVM = System.getProperty("powerjob.network.local.address");

解决方案

在运行代码前,配置 JVM 环境变量:

复制代码
-Dpowerjob.network.local.address=192.168.1.99

重新运行项目,问题成功解决!

问题回顾

在解决本地开发机无法连接PowerJob服务器的过程中,我经历了从依赖AI到自主排查的完整过程。最终通过源码调试找到了问题根源,但这个过程中的体会远比技术解决方案本身更值得记录。

我的真实体悟

1. AI无法解决所有问题,尤其涉及版本差异时

  • 配置兼容性问题:AI提供的许多PowerJob配置方案,在我的版本中并不支持

  • 版本特定性:不同版本的PowerJob配置项存在差异,通用建议可能不适用

  • 局限认知:AI难以了解我使用的具体版本和环境细节

2. 源码排查比想象中简单高效

  • 精准定位:通过错误日志直接定位到具体代码位置

  • 快速验证:在关键代码处设置断点,运行调试

  • 直击核心 :迅速找到System.getProperty("powerjob.network.local.address")这行关键代码

3. AI协助的价值在于前期铺垫

虽然最终是通过源码调试解决问题,但前期的AI协助并非徒劳:

  • 排除可能性:AI建议帮助我过滤掉了许多常见问题

  • 积累认知:通过尝试各种方案,加深了对问题边界的理解

  • 聚焦方向:失败的经验让我明确了正确的排查方向

相关推荐
侠客行031711 小时前
Mybatis连接池实现及池化模式
java·mybatis·源码阅读
蛇皮划水怪11 小时前
深入浅出LangChain4J
java·langchain·llm
老毛肚12 小时前
MyBatis体系结构与工作原理 上篇
java·mybatis
风流倜傥唐伯虎13 小时前
Spring Boot Jar包生产级启停脚本
java·运维·spring boot
Yvonne爱编码13 小时前
JAVA数据结构 DAY6-栈和队列
java·开发语言·数据结构·python
Re.不晚13 小时前
JAVA进阶之路——无奖问答挑战1
java·开发语言
你这个代码我看不懂13 小时前
@ConditionalOnProperty不直接使用松绑定规则
java·开发语言
fuquxiaoguang13 小时前
深入浅出:使用MDC构建SpringBoot全链路请求追踪系统
java·spring boot·后端·调用链分析
琹箐13 小时前
最大堆和最小堆 实现思路
java·开发语言·算法
__WanG14 小时前
JavaTuples 库分析
java