arthas线上不停机修改bug

安装arthas

shell 复制代码
wget https://alibaba.github.io/arthas/arthas-boot.jar

启动:

java -jar arthas-boot.jar

启动失败

使用jps也没查到对应的进程

发生错误信息

使用进程id启动,报错

进程id查看使用命令:

ps -ef | grep java

详情:

shell 复制代码
[INFO] JAVA_HOME: /usr/local/java/jdk17
[INFO] arthas-boot version: 4.0.5
[INFO] Start download arthas from remote server: https://arthas.aliyun.com/download/4.0.5?mirror=aliyun
[INFO] Download arthas success.
[INFO] arthas home: /home/appadmin/.arthas/lib/4.0.5/arthas
[INFO] Try to attach process 4004020
Picked up JAVA_TOOL_OPTIONS: 
[ERROR] Start arthas failed, exception stack trace: 
java.io.IOException: Operation not permitted
        at jdk.attach/sun.tools.attach.VirtualMachineImpl.sendQuitTo(Native Method)
        at jdk.attach/sun.tools.attach.VirtualMachineImpl.<init>(VirtualMachineImpl.java:82)
        at jdk.attach/sun.tools.attach.AttachProviderImpl.attachVirtualMachine(AttachProviderImpl.java:58)
        at jdk.attach/com.sun.tools.attach.VirtualMachine.attach(VirtualMachine.java:207)
        at com.taobao.arthas.core.Arthas.attachAgent(Arthas.java:100)
        at com.taobao.arthas.core.Arthas.<init>(Arthas.java:27)
        at com.taobao.arthas.core.Arthas.main(Arthas.java:161)
[INFO] Attach process 4004020 success.
[INFO] arthas-client connect 127.0.0.1 3658
Connect to telnet server error: 127.0.0.1 3658
java.net.ConnectException: Connection refused
        at java.base/sun.nio.ch.Net.pollConnect(Native Method)
        at java.base/sun.nio.ch.Net.pollConnectNow(Net.java:672)
        at java.base/sun.nio.ch.NioSocketImpl.timedFinishConnect(NioSocketImpl.java:547)
        at java.base/sun.nio.ch.NioSocketImpl.connect(NioSocketImpl.java:602)
        at java.base/java.net.SocksSocketImpl.connect(SocksSocketImpl.java:327)
        at java.base/java.net.Socket.connect(Socket.java:633)
        at org.apache.commons.net.SocketClient.connect(SocketClient.java:188)
        at org.apache.commons.net.SocketClient.connect(SocketClient.java:209)
        at com.taobao.arthas.client.TelnetConsole.process(TelnetConsole.java:306)
        at com.taobao.arthas.client.TelnetConsole.main(TelnetConsole.java:166)
        at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:77)
        at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.base/java.lang.reflect.Method.invoke(Method.java:568)
        at com.taobao.arthas.boot.Bootstrap.main(Bootstrap.java:634)
Usage: arthas-client [--help] [-c <value>] [-f <value>] [-w <value>] [-t
       <value>] [-h <value>] [target-ip] [port]

Arthas Telnet Client

查询日志告知是 : Arthas 在尝试附加到目标 Java 进程(PID 为 4004020)时遇到了问题,并且 Telnet 客户端无法连接到 Arthas Server。

  • 误发生在 sun.tools.attach.VirtualMachineImpl.sendQuitTo(Native Method) 中。
  • 原因分析:
    1. 权限不足:
      • 当前用户(appadmin)没有权限访问目标进程(PID 4004020)。
      • 如果目标进程由 root 用户启动,而你以普通用户运行 Arthas,则会导致权限问题。

使用ps -ef | grep java查看java进程

检查权限

查看目标进程的用户信息:

shell 复制代码
ps -ef | grep 4004020

输出如下:

目标进程由 root 用户启动,而你以普通用户(appadmin)运行 Arthas,因此权限不足

解决方式:

使用下面命令尝试:

shell 复制代码
sudo java -jar arthas-boot.jar 4004020

结果报错:

查询报错原因是:在使用 sudo 提升权限后,系统无法找到 java 命令。

错误原因分析

(1) sudo 的环境变量问题
  • 当你直接运行 java -jar arthas-boot.jar 时,java 是通过当前用户的环境变量(如 PATH)找到的。
  • 使用 sudo 后,环境变量会切换到 root 用户的环境变量,而 root 用户的 PATH 中可能没有包含 java 的路径。

2. 解决方案

(1) 明确指定 java 的完整路径
  • 直接使用 java 的绝对路径来运行命令,避免依赖 PATH 环境变量。

    shell 复制代码
    sudo /usr/local/java/jdk17/bin/java -jar arthas-boot.jar 4004020

可以看到启动成功:

反编译错误的代码位置

接下来使用jad命令 将需要更改的文件先进行反编译,保存下来 ,编译器修改放到tmp目录下

shell 复制代码
 jad --source-only org.mili.order.domain.bo.OrderServiceCompleteVerifyBo > /tmp/OrderServiceCompleteVerifyBo.java

将 OrderServiceCompleteVerifyBo.java下载下来后修改错误的地方(我这里是指删了一个NotNull的一个注解)

查看hash码(类加载器的)

shell 复制代码
sc -d org.mili.order.domain.bo.OrderServiceCompleteVerifyBo | grep classLoaderHash

返回如下:

shell 复制代码
 classLoaderHash   7a765367

将修改后的文件放到tmp/zss/ 目录下,MC命令 用指定的classloader类加载器的hash码重新将类在内存中编译

shell 复制代码
 mc -c 7a765367 /tmp/zss/OrderServiceCompleteVerifyBo.java -d /tmp/zss

替换字节码文件

redefine命令 将编译后的类加载到JVM

下面是上边编译后的.class文件地址

shell 复制代码
redefine /tmp/zss/org/mili/order/domain/bo/OrderServiceCompleteVerifyBo.class

如下图

关闭arthas,测试即可

shell 复制代码
stop

操作记录如下图片

相关推荐
hui函数4 小时前
Python系列Bug修复PyCharm控制台pip install报错:如何解决 pip install 网络报错 企业网关拦截 User-Agent 问题
python·pycharm·bug
猫头虎4 小时前
Claude Code 永动机:ralph-loop 无限循环迭代插件详解(安装 / 原理 / 最佳实践 / 避坑)
ide·人工智能·langchain·开源·编辑器·aigc·编程技术
hui函数4 小时前
如何解决 pip install 代理报错 SOCKS5 握手失败 ReadTimeoutError 问题
bug·pip
我命由我123454 小时前
Android Studio - Android Studio 去除 import 的未使用的类
android·java·ide·学习·java-ee·android studio·学习方法
hi0_66 小时前
vibe coding 开发软件(一) 模型选择和agent简单使用
ide·个人开发·visual studio
f***24116 小时前
Bug悬案:程序员破案实录
bug
惊讶的猫6 小时前
vscode+conda
ide·vscode·conda
谧小夜6 小时前
Visual Studio Code中实现Go语言自动导包教程
ide·vscode·golang
林_学7 小时前
扔掉了本地 IDE,开发部署只要 3 分钟。
ide
白露与泡影7 小时前
放弃 IntelliJ IDEA,转 VS Code 了。。
java·ide·intellij-idea