Java 把 CPU 干爆了,教你两种方法分分钟定位代码问题

🍄 大家好,我是风筝

🌍 个人博客:【古时的风筝】。

本文目的为个人学习记录及知识分享。如果有什么不正确、不严谨的地方请及时指正,不胜感激。

每一个赞都是我前进的动力。

公众号:「古时的风筝」

首先,先用放之四海而皆准的命令 top,确认一下是不是 Java 进程是罪魁祸首。Java 进程要不然就是个后台任务,要不然就是个 jar 包,比如一个Spring Boot 服务。

刚接触开发那会儿,别的命令都不会,一看到CPU飙升,上来就是一个 top,当top 命令执行完了,也就完了。就像一个举重选手用尽了所有力气,然后就只能呆坐在哪里了。

下面介绍两种后续操作,让我们在执行完 top以后,确定是 Java 进程搞的鬼的情况下,顺利的找出出现问题的方法。

第一种,用系统工具和 JDK 自带的 jstack 工具。 第二种,用 Arthas 探测工具。

使用 jstack 工具

第一步,使用 top 找到占用 CPU 最高的 Java 进程

前面说了这一步,就是使用 Top 命令

使用 top命令发现占用 CPU 99.7% 的线程是 Java 进程,进程 PID 为 13731

第二步,找到占用 CPU 最高的线程

上一步用 top命令找到了那个 Java 进程。那一个进程中有那么多线程,不可能所有线程都一直占着 CPU 不放,这一步要做的就是揪出这个罪魁祸首,当然有可能不止一个。

接下来,还是用 top命令,只不过加一个参数-Hp ,就是下面这样

bash 复制代码
top -Hp pid

H参数表示要显示线程级别的信息,p则表示指定的pid,也就是进程id。代入前面得到的那个Java进程,完整的命令是这样的

bash 复制代码
top -Hp 13731

执行之后,这个Java进程中占用线程占用 CPU 的情况就列出来了。

可以看到占用 CPU 最高的那个线程 PID 为 13756

第三步,保存线程堆栈信息

这就要用到 JDK 默认提供的一个工具了,叫做 jstack。当你安装了 JDK 之后,在 bin目录下会有一大堆内置的工具,java也是其中之一,还有另外我们可能比较熟悉的 javac

jstack 用于生成 Java 进程的线程快照(thread dump)。线程快照是一个关于 Java 进程中所有线程当前状态的快照,包括每个线程的堆栈信息。通过分析线程快照,可以了解 Java 进程中各个线程的运行状态、锁信息等。

我们用jstack的目的就是将那个占用 CPU 最高的线程的堆栈信息搞下来,然后进一步分析。 使用命令 jstack pid > out.log将某个进程的堆栈信息输出到 out.log文件中。

当前 Java 程序的所有线程信息都可以通过 jstack命令查看,我们用jstack命令将第一步找到的 Java 进程的线程栈保存下来。

shell 复制代码
jstack 13731 > thread_stack.log

第四步,在线程栈中查找最贵祸首的线程

第二步已经找到了这个罪魁祸首的线程 PID 是 13756

然后我们将 13756转换为 16 进制的,可以用在线进制转换的网站直接转换,比如 tool.oschina.net/hexconvert 这个,转换结果为 0x35bc

最后,我们在线程栈中,也就是上一步保存的那个 thread_stack.log 文件,在里面查找这个16进制的线程 id (0x35bc)。

然后,我么能看到了我们需要的线程名称、线程状态,哪个方法的哪一行代码消耗了最多的 CPU 都很清楚了。

第二种,Arthas

Arthas 是阿里开源的一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。

用 Arthas 查找占用 CPU 最高的方法只是一个开胃小菜,除此之外,它最大的用途是在不改代码、不重启服务的情况下对程序进行动态监控。如果你碰到了线上诡异问题,一定要用 Arthas 尝试找一找问题,开阔一下眼界。

好了,更多的功能到官网 arthas.aliyun.com/ 了解吧,接下来就将一下如何用 Arthas 达到前面用 jstack 同样的目的。

安装 Arthas

当然了,要使用 Arthas,你就必须先把它安装到你的目标服务器上,也就是那个出问题的Java服务所在的服务器。

下载 jar 包

bash 复制代码
curl -O https://arthas.aliyun.com/arthas-boot.jar

启动 Arthas 服务

bash 复制代码
java -jar arthas-boot.jar

启动之后,会列出当前这台服务器上的所有 Java 进程,然后你选择你要排查的那个服务即可。

然后出现 arthas@之后表示已经启动,并成功 attach 到目标进程上 。

然后可以输入命令 dashboard看一下实时面板,默认 5 秒刷新一次,在这个面板上能够看到线程、内存堆栈、GC和Runtime的基本信息。如果你用过 VisualVM 的话,就和那个基本一样。

好了,开始用 Arthas 找到导致 CPU 负载过高的问题吧。

找到占用CPU最高的进程

第一步,其实还是用 top命令找到占用 CPU 最高的进程,也就是 Arthas 启动时选择 attach 的那个 Java 进程。

然后 java -jar arthas-boot.jar启动Arthas,并attach 。

找到占用 CPU 最高的线程

执行 thread命令,这个命令会显示所有线程的信息,并且把CPU使用率高的线程排在前面。

这样,一眼就看出来了,第一个线程的 CPU 使用率高达 99% 了,就是它。

查看堆栈信息

使用 thread ID 获取堆栈信息,其实就是 jstack pid相同的作用。通过前一步看到这个线程的 ID 是18,然后执行 thread 18

然后直接就看出来了出现问题的位置,TestController.java文件的 high方法的第23行。然后进代码看

java 复制代码
com.moonkite.wallpapermanage.controller.TestController.high(TestController.java:23)

这个方法是我故意写的死循环,真实情况当然没有这么明显,还需要针对具体代码认真分析。

总结

高 CPU 占用率这个问题是一种很常见也很典型的线上问题,排查方式只要按上述顺序记下来就基本上没什么问题。

其实还是推荐使用 Arthas,除了它确实功能非常多之外,还有就是在线上场景下,使用 jstack有时会碰到问题,如果这个线程已经忙的一点转圜的余地都没有了,jstack命令可能会执行失败。

有用的话,『给个赞』吧 ~

还可以看看往期文章

我患上了空指针后遗症

用了8年的方式-用 Docker 瞬间搭建本地开发环境

RPC框架的核心到底是什么

相关推荐
hanbarger3 分钟前
mybatis框架——缓存,分页
java·spring·mybatis
cdut_suye11 分钟前
Linux工具使用指南:从apt管理、gcc编译到makefile构建与gdb调试
java·linux·运维·服务器·c++·人工智能·python
苹果醋323 分钟前
2020重新出发,MySql基础,MySql表数据操作
java·运维·spring boot·mysql·nginx
小蜗牛慢慢爬行24 分钟前
如何在 Spring Boot 微服务中设置和管理多个数据库
java·数据库·spring boot·后端·微服务·架构·hibernate
azhou的代码园27 分钟前
基于JAVA+SpringBoot+Vue的制造装备物联及生产管理ERP系统
java·spring boot·制造
wm10431 小时前
java web springboot
java·spring boot·后端
smile-yan1 小时前
Provides transitive vulnerable dependency maven 提示依赖存在漏洞问题的解决方法
java·maven
老马啸西风1 小时前
NLP 中文拼写检测纠正论文-01-介绍了SIGHAN 2015 包括任务描述,数据准备, 绩效指标和评估结果
java
Earnest~1 小时前
Maven极简安装&配置-241223
java·maven
皮蛋很白1 小时前
Maven 环境变量 MAVEN_HOME 和 M2_HOME 区别以及 IDEA 修改 Maven repository 路径全局
java·maven·intellij-idea