arthas线上问题检查思路

📢📢📢📣📣📣

哈喽!大家好,我是「奇点」,江湖人称 singularity。刚工作几年,想和大家一同进步🤝🤝

一位上进心十足的【Java ToB端大厂领域博主】!😜😜😜

喜欢java和python,平时比较懒,能用程序解决的坚决不手动解决😜😜😜

✨ 如果有对【java】感兴趣的【小可爱】,欢迎关注我

❤️❤️❤️感谢各位大可爱小可爱!❤️❤️❤️


如果觉得本文对你有帮助,欢迎点赞,欢迎关注我,如果有补充欢迎评论交流,我将努力创作更多更好的文章。

背景

是不是在实际开发工作当中经常碰到自己写的代码在开发、测试环境行云流水稳得一笔,可一到线上就经常不是缺这个就是少那个反正就是一顿报错抽风似的,线上调试代码又很麻烦,让人头疼得抓狂;而且debug不一定是最高效的方法,遇到线上问题不能debug了怎么办。原先我们Java中我们常用分析问题一般是使用JDK自带或第三方的分析工具如jstat、jmap、jstack、 jconsole、visualvm、Java Mission Control、MAT等。但此刻的你没有看错,还有一款神器Arthas工具着实让人吃惊,可帮助程序员解决很多繁琐的问题,使得加班解决线上问题成为过去的可能性大大提高。

定义

Arthas是一个Java诊断工具,由阿里巴巴中间件团队开源,目前已在Java开发人员中被广泛采用。Arthas能够分析,诊断,定位Java应用问题,例如:JVM信息,线程信息,搜索类中的方法,跟踪代码执行,观测方法的入参和返回参数等等。并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法的出入参,异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。简单的话:就是再不重启应用的情况下达到排查问题的目的。

安装与启动

下载arthas-boot.jar
curl -O https://arthas.aliyun.com/arthas-boot.jar

然后用java -jar的方式启动:

java -jar arthas-boot.jar

注意事项:

arthas-boot使用的jdk版本,需要与要监控的进程jdk版本保持一致,否则会启动失败。

使用指定jdk版本启动:

/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/bin/java -jar arthas-boot.jar

分析步骤

  1. 通过dashboard命令查看当前系统的实时数据,例如CPU占用率,heap占用率等;
  2. 如果有CPU占用异常,通过thread命令,查看CPU占用率高的线程的堆栈,找到对应的类和方法再进一步分析;
  3. 如有堆栈占用异常,在heap占用率高时,通过heapdump 命令下载heapdump文件到本地,分析占用内存高的未被回收的对象,再通过寻找创建对象的方法分析原因;
  4. 通过profiler命令,分析执行方法的CPU占用率;
  5. 通过trace命令,可以分析方法内部调用路径和输出方法路径上的每个节点上耗时,在耗时长的路径上思考优化方案;

常用命令

官方命令列表:

arthas.aliyun.com/doc/command...

dashboard命令

查看当前系统的实时数据,如CPU占用率,heap占用率等

trace 命令

trace com.xx.dso.service generateDsoExcel

方法内部调用路径,并输出方法路径上的每个节点上耗时

heapdump 命令

创建到指定文件夹下

heapdump --live /Users/xxx/Documents/dump.hprof

当我们拿到hprof文件后,该如何分析呢,这时候我们可以用到jdk自带的jhat命令进行分析。

创建成功后,我们就可以在指定文件夹下看到对应的dump文件,然后使用命令jhat dump.hprof,生成文件,成功后我们就可以通过IP+端口进行访问了

jhat dump.hprof

如果报错端口被占用,可以指定端口打开

jhat -port 7001 dump.hprof

出现Started HTTP server on port 7000信息时,咱们就可以使用IP+port进行访问了。例如访问 localhost:7001

profiler命令

通过不断的采样,然后把收集到的采样结果生成火焰图。

//启动
$ profiler start  
Profiling started

//停止,并生成HTML格式的结果
$ profiler stop --format html
profiler output file: /xxx/arthas-output/20220727-145209.html
OK

在arthas启动的状态下,可以通过浏览器访问http://localhost:3658/arthas-output/ 或启动位置的 arthas-output 下面查看 profiler 结果

常见问题

  1. 启动时:[ERROR] attach fail, targetPid: XXX

原因:异常退出,导致端口被占用,并且不能通过kill -9 来清除掉这个端口

解决方法:使用同一个端口启动,进入刚刚选择的进程,执行stop命令完全退出

后续会根据每一个场景的排查命令列举示例

参考文章

www.wdbyte.com/2019/11/art...

blog.fastthread.io/tag/heap-du...

相关推荐
韩楚风2 小时前
【linux 多进程并发】linux进程状态与生命周期各阶段转换,进程状态查看分析,助力高性能优化
linux·服务器·性能优化·架构·gnu
长天一色11 小时前
【ECMAScript 从入门到进阶教程】第三部分:高级主题(高级函数与范式,元编程,正则表达式,性能优化)
服务器·开发语言·前端·javascript·性能优化·ecmascript
裴云飞2 天前
鸿蒙性能优化之布局优化
性能优化·harmonyos
kingapex12 天前
性能优化-数据库分区技术深入解析
数据库·oracle·性能优化·数据库设计
胡耀超3 天前
知识图谱入门——6:Cypher 查询语言高级组合用法(查询链式操作、复杂路径匹配、条件逻辑、动态模式创建,以及通过事务控制和性能优化处理大规模数据。
性能优化·知识图谱·cypher
EterNity_TiMe_3 天前
【Linux进程间通信】Linux匿名管道详解:构建进程间通信的隐形桥梁
linux·运维·redis·缓存·性能优化·学习方法
PangPiLoLo3 天前
高性能架构—存储高性能
java·数据库·redis·性能优化·架构
刘大猫.4 天前
Arthas sc(查看JVM已加载的类信息 )
jvm·arthas·sc·arthas命令·查看jvm已加载的类信息
Hello Dam4 天前
【文件增量备份系统】MySQL百万量级数据量分页查询性能优化
java·mysql·性能优化·springboot·深分页优化