Arthas 线上问题排查实战:CPU过高、频繁GC

Arthas 是阿里开源的Java线上诊断工具,无需重启服务、无需修改代码,直接attach到JVM进程,一键排查CPU飙高、频繁GC、线程死锁、方法慢调用等问题。

我给你整理最实用、最常用、直接复制就能用 的排查命令,覆盖 CPU 过高频繁GC 两大核心场景。

一、快速入门:安装 & 启动

1. 安装(一行命令)

bash 复制代码
curl -O https://arthas.aliyun.com/arthas-boot.jar

2. 启动(attach 目标进程)

bash 复制代码
java -jar arthas-boot.jar

启动后会列出所有Java进程,输入进程编号回车即可attach。


二、场景1:CPU 使用率过高排查

核心目标

找到哪个线程哪个方法占用CPU最高。

1. 一键查看CPU占用最高的线程

bash 复制代码
thread -n 3
  • -n 3:显示CPU占用前3的线程
  • 直接输出:线程ID、线程名、CPU占比、栈轨迹

2. 查看某个线程的详细栈(定位具体代码行)

bash 复制代码
thread 线程ID

例如:

bash 复制代码
thread 123

会打印该线程完整调用栈,直接定位到代码行

3. 实时查看CPU曲线

bash 复制代码
dashboard

实时面板:CPU、内存、GC、线程状态,按 q 退出

4. 统计方法执行耗时(定位慢方法)

bash 复制代码
monitor -c 5 com.xxx.service.UserService getUserInfo
  • -c 5:每5秒统计一次
  • 输出:调用次数、平均耗时、成功/失败率

5. 追踪方法内部调用耗时

bash 复制代码
trace com.xxx.service.UserService getUserInfo

trace 是排查CPU高最神器的命令

会打印方法内部每一行代码的执行耗时,直接找到慢逻辑。


三、场景2:频繁GC / 内存溢出 排查

核心目标

  • 是不是频繁GC?Young GC / Full GC 频率?
  • 谁在占用大量内存?
  • 是不是内存泄漏?

1. 查看GC情况(最常用)

bash 复制代码
dashboard

看右侧 GC 区域

  • GC count:GC总次数
  • GC time:GC总耗时
  • 如果 FullGC 频繁、且耗时很高 → 内存有问题

2. 详细GC统计

bash 复制代码
gc -i 1000
  • 每1秒打印一次GC信息
  • 能看到 YoungGC/FullGC 频率、耗时、提升效率

3. 查看堆内存使用

bash 复制代码
jvm

查看:

  • 堆最大/已用/空闲
  • 元空间、新生代、老年代大小
  • 直接内存使用

4. 导出堆dump(排查内存泄漏)

bash 复制代码
heapdump /tmp/myheap.hprof

导出后用 MAT/JProfiler 分析:

  • 谁占用内存最大
  • 是不是内存泄漏
  • 哪个对象无法被回收

5. 查看最多的对象(快速定位大对象)

bash 复制代码
sm -a

bash 复制代码
classloader

四、高频万能命令(必背)

bash 复制代码
dashboard       # 实时总面板(CPU、内存、线程、GC)
thread -n 3     # 查CPU最高的3个线程
thread 123      # 查具体线程栈
trace 类 方法   # 查方法内部耗时(排查CPU高、慢接口)
gc              # 查看GC情况
jvm             # 查看JVM配置
heapdump        # 导出堆快照
watch           # 观察方法入参、出参、异常

五、完整排查流程(直接照着做)

CPU过高排查流程

  1. dashboard 确认是CPU飙高
  2. thread -n 3 找到最耗CPU的线程
  3. thread 线程ID 看代码栈
  4. trace 类名 方法名 定位具体慢代码行

频繁GC排查流程

  1. dashboard 看GC次数飙升
  2. gc 确认FullGC频繁
  3. jvm 看内存配置是否合理
  4. heapdump 导出dump分析大对象/内存泄漏

总结

  • CPU高 :用 thread + trace 定位耗CPU线程与慢方法
  • 频繁GC :用 dashboard + gc + heapdump 定位内存问题
  • Arthas 全程无侵入、不重启、线上直接用
相关推荐
Michaelwubo1 小时前
swagger全集通+mock(prism)
java
ss2732 小时前
ai编程Trae cn生成图书管理系统(1)
java·数据库·spring boot·python·flask·fastapi
如竟没有火炬2 小时前
寻找峰值——二分
java·开发语言·数据结构·python·算法·散列表
Lumbrologist2 小时前
【C++】零基础入门 · 第 17 节:多线程编程基础
java·c++·算法
tkevinjd2 小时前
事务、ACID与隔离
java·数据库·sql
阿洛学长2 小时前
Kali Linux 虚拟机安装(VMware Workstation 17)
java·linux·服务器
AI人工智能+电脑小能手2 小时前
【大白话说Java面试题 第91题】【Mysql篇】第21题:分布式锁的使用场景和原理?
java·数据库·分布式·mysql·面试
JAVA社区2 小时前
Java高级全套教程(十三)—— 分布式锁超详细实战详解(原理+三种方案企业级落地)
java·开发语言·分布式·spring cloud·面试·java-zookeeper
Mahir082 小时前
MyBatis 延迟加载深度解密:从使用方式到底层动态代理原理全解
java·后端·面试·mybatis