Arthas 线上问题排查实战:CPU过高、频繁GC

Arthas 是阿里开源的Java线上诊断工具,无需重启服务、无需修改代码,直接attach到JVM进程,一键排查CPU飙高、频繁GC、线程死锁、方法慢调用等问题。

我给你整理最实用、最常用、直接复制就能用 的排查命令,覆盖 CPU 过高频繁GC 两大核心场景。

一、快速入门:安装 & 启动

1. 安装(一行命令)

bash 复制代码
curl -O https://arthas.aliyun.com/arthas-boot.jar

2. 启动(attach 目标进程)

bash 复制代码
java -jar arthas-boot.jar

启动后会列出所有Java进程,输入进程编号回车即可attach。


二、场景1:CPU 使用率过高排查

核心目标

找到哪个线程哪个方法占用CPU最高。

1. 一键查看CPU占用最高的线程

bash 复制代码
thread -n 3
  • -n 3:显示CPU占用前3的线程
  • 直接输出:线程ID、线程名、CPU占比、栈轨迹

2. 查看某个线程的详细栈(定位具体代码行)

bash 复制代码
thread 线程ID

例如:

bash 复制代码
thread 123

会打印该线程完整调用栈,直接定位到代码行

3. 实时查看CPU曲线

bash 复制代码
dashboard

实时面板:CPU、内存、GC、线程状态,按 q 退出

4. 统计方法执行耗时(定位慢方法)

bash 复制代码
monitor -c 5 com.xxx.service.UserService getUserInfo
  • -c 5:每5秒统计一次
  • 输出:调用次数、平均耗时、成功/失败率

5. 追踪方法内部调用耗时

bash 复制代码
trace com.xxx.service.UserService getUserInfo

trace 是排查CPU高最神器的命令

会打印方法内部每一行代码的执行耗时,直接找到慢逻辑。


三、场景2:频繁GC / 内存溢出 排查

核心目标

  • 是不是频繁GC?Young GC / Full GC 频率?
  • 谁在占用大量内存?
  • 是不是内存泄漏?

1. 查看GC情况(最常用)

bash 复制代码
dashboard

看右侧 GC 区域

  • GC count:GC总次数
  • GC time:GC总耗时
  • 如果 FullGC 频繁、且耗时很高 → 内存有问题

2. 详细GC统计

bash 复制代码
gc -i 1000
  • 每1秒打印一次GC信息
  • 能看到 YoungGC/FullGC 频率、耗时、提升效率

3. 查看堆内存使用

bash 复制代码
jvm

查看:

  • 堆最大/已用/空闲
  • 元空间、新生代、老年代大小
  • 直接内存使用

4. 导出堆dump(排查内存泄漏)

bash 复制代码
heapdump /tmp/myheap.hprof

导出后用 MAT/JProfiler 分析:

  • 谁占用内存最大
  • 是不是内存泄漏
  • 哪个对象无法被回收

5. 查看最多的对象(快速定位大对象)

bash 复制代码
sm -a

bash 复制代码
classloader

四、高频万能命令(必背)

bash 复制代码
dashboard       # 实时总面板(CPU、内存、线程、GC)
thread -n 3     # 查CPU最高的3个线程
thread 123      # 查具体线程栈
trace 类 方法   # 查方法内部耗时(排查CPU高、慢接口)
gc              # 查看GC情况
jvm             # 查看JVM配置
heapdump        # 导出堆快照
watch           # 观察方法入参、出参、异常

五、完整排查流程(直接照着做)

CPU过高排查流程

  1. dashboard 确认是CPU飙高
  2. thread -n 3 找到最耗CPU的线程
  3. thread 线程ID 看代码栈
  4. trace 类名 方法名 定位具体慢代码行

频繁GC排查流程

  1. dashboard 看GC次数飙升
  2. gc 确认FullGC频繁
  3. jvm 看内存配置是否合理
  4. heapdump 导出dump分析大对象/内存泄漏

总结

  • CPU高 :用 thread + trace 定位耗CPU线程与慢方法
  • 频繁GC :用 dashboard + gc + heapdump 定位内存问题
  • Arthas 全程无侵入、不重启、线上直接用
相关推荐
咖啡八杯1 小时前
GoF设计模式——策略模式
java·后端·spring·设计模式
用户128526116029 小时前
我把祖传Java项目重构后,接口响应从3s砍到了200ms,只改了这几行代码
java
Linsk9 小时前
组件 = 模板 + 业务逻辑
java·前端·vue.js
星沉远浦10 小时前
用Gemini高效解决Java代码报错难以定位的问题
java
用户2986985301414 小时前
Word 文档字符级格式化:Java 实现方案详解
java·后端
笨鸟飞不快14 小时前
从单个服务到集群:一次完整的性能排查复盘
java·前端
荣码14 小时前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
SamDeepThinking14 小时前
Java微服务练习方式
java·后端·微服务
朦胧之1 天前
AI 编程-老项目改造篇
java·前端·后端
程序猿大帅1 天前
别再只当调包侠了:用 Spring AI 落地 Function Calling,我被大模型硬生生砸出了三个大坑
java