解决本地 Windows 开发机无法注册到 PowerJob 服务器的问题

问题背景

我有一个 Linux 服务器(192.168.1.255),上面部署了 PowerJob 和我的 Java 微服务。我的开发机是 Windows 系统(192.168.1.99)。当我把微服务部署到服务器的 Docker 中时,它能成功注册到 PowerJob,但在本地开发环境下却总是注册失败。

复制代码
2025-12-13 12:37:20.910 WARN  [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600620853, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1414, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0181, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.912 WARN  [oms-akka.actor.default-dispatcher-15] t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23] - [TroubleshootingActor] receive DeadLetter: DeadLetter(WorkerHeartbeat(workerAddress=172.23.64.1:42103, appName=yu_bei_factory_prd_qualityCenter_job, appId=4, heartbeatTime=1765600635862, containerInfos=[], version=4.0.1, protocol=AKKA, tag=null, client=Atlantis, extra=null, systemMetrics=SystemMetrics(cpuProcessors=16, cpuLoad=-1.0, jvmUsedMemory=0.1466, jvmMaxMemory=7.8281, jvmMemoryUsage=0.0187, diskUsed=321.2424, diskTotal=951.6455, diskUsage=0.3376, extra=null, score=16)),Actor[akka://oms/deadLetters],Actor[akka://oms/deadLetters])
2025-12-13 12:37:20.918 WARN  [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], message stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.919 WARN  [oms-akka.actor.default-dispatcher-5] a.s.Materializer - [$anonfun$applyOrElse$2,90] - [outbound connection to [akka://oms-server@192.168.1.225:10086], control stream] Upstream failed, cause: StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.921 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Quarantine of [akka://oms-server@192.168.1.225:10086] ignored because unknown UID. Reason: Outbound control stream restarted. akka.stream.StreamTcpException: The connection has been aborted
2025-12-13 12:37:20.924 WARN  [oms-akka.actor.default-dispatcher-5] a.r.a.Association - [$anonfun$applyOrElse$2,90] - Outbound control stream to [akka://oms-server@192.168.1.225:10086] failed. Restarting it. akka.stream.StreamTcpException: The connection has been aborted

配置信息

Java 微服务连接 PowerJob 的配置如下:

复制代码
powerjob:
  worker:
    akka-port: 42103
    app-name: yu_bei_factory_prd_qualityCenter_job
    server-address: 192.168.1.225:7700
    store-strategy: disk

错误现象

本机运行时出现以下错误日志:

复制代码
Outbound message stream to [akka://oms-server@192.168.1.225:10086] failed.

错误日志显示,连接 PowerJob 的 10086 端口失败。但奇怪的是,我通过 telnet 192.168.1.225 10086测试发现端口是通的。

排查过程

第一阶段:初步排查

  1. 检查错误日志,发现一个关键信息:workerAddress=172.23.64.1:42103

    这显示本机通过 42103 端口连接 PowerJob 时使用的 IP 是 172.23.64.1,而不是我期望的 192.168.1.99

  2. 检查本机网络配置:

    发现本机有两个 IP 地址

    以太网适配器 以太网:
    IPv4 地址: 192.168.1.99

    以太网适配器 vEthernet (Default Switch):
    IPv4 地址: 172.23.64.1

第二阶段:AI 建议尝试

我咨询了 AI,它给出了多种解决方案:

  1. 配置 Java 环境变量使用 IPv4

  2. 尝试各种 PowerJob 的 IP 相关配置

  3. 检查 PowerJob 服务的 10086 端口绑定情况

    • 通过 netstat -tlnp | grep 10086确认端口已正确绑定在内网 IP 上

但所有这些方案都没有解决问题。

第三阶段:源码级排查

今天我决定通过源码排查来解决这个问题:

  1. 定位报错代码位置

    • 从错误信息 t.p.w.a.TroubleshootingActor - [onReceiveDeadLetter,23]找到报错代码位置
  2. 设置断点调试

    • 在对应位置设置断点

    • 运行项目,当代码停在断点处时,通过调用栈逐步向上追踪

  3. 找到关键代码

    • 最终找到了 PowerJob 获取 workerAddress 的地方:

    String addressFromJVM = System.getProperty("powerjob.network.local.address");

解决方案

在运行代码前,配置 JVM 环境变量:

复制代码
-Dpowerjob.network.local.address=192.168.1.99

重新运行项目,问题成功解决!

问题回顾

在解决本地开发机无法连接PowerJob服务器的过程中,我经历了从依赖AI到自主排查的完整过程。最终通过源码调试找到了问题根源,但这个过程中的体会远比技术解决方案本身更值得记录。

我的真实体悟

1. AI无法解决所有问题,尤其涉及版本差异时

  • 配置兼容性问题:AI提供的许多PowerJob配置方案,在我的版本中并不支持

  • 版本特定性:不同版本的PowerJob配置项存在差异,通用建议可能不适用

  • 局限认知:AI难以了解我使用的具体版本和环境细节

2. 源码排查比想象中简单高效

  • 精准定位:通过错误日志直接定位到具体代码位置

  • 快速验证:在关键代码处设置断点,运行调试

  • 直击核心 :迅速找到System.getProperty("powerjob.network.local.address")这行关键代码

3. AI协助的价值在于前期铺垫

虽然最终是通过源码调试解决问题,但前期的AI协助并非徒劳:

  • 排除可能性:AI建议帮助我过滤掉了许多常见问题

  • 积累认知:通过尝试各种方案,加深了对问题边界的理解

  • 聚焦方向:失败的经验让我明确了正确的排查方向

相关推荐
weixin_399380691 分钟前
TongWeb异常宕机问题分析
java·tomcat
小鸡脚来咯2 分钟前
设计模式面试介绍指南
java·开发语言·单例模式
怦怦蓝6 分钟前
详解 IntelliJ IDEA 中编写邮件发送功能(从环境搭建到实战落地)
java·spring boot·intellij-idea
DENG8623048 分钟前
二、使用idea运行Quarkus项目及调试
java·intellij-idea·quarkus
ipooipoo118810 分钟前
跨境电商IP选型指南:静态IP vs 动态IP 的区别
网络·网络协议·tcp/ip
sww_102611 分钟前
Spring AI Structured-Output源码分析
java·人工智能·spring
IT_Octopus12 分钟前
java 实体属性 Map 解决 mybatis-plus wrapper selectone 查mysql json类型为null 问题
java·mysql·mybatis
我的golang之路果然有问题16 分钟前
Docker 之常用操作(实习中的)
java·运维·笔记·docker·容器·eureka