JAVA-WEB系统问题排查闲扯

冒泡的肥皂2025-04-17 22:05

排查一些模糊的东西

1.客户反馈系统慢
2.系统假死了
3.前面两点的排查后最终还是要落到某个点的优化（但是如何找到这个点？

遇到这类问题要做的事

1.出问题首先把系统dump文件导出来（切记重启不是第一位）

perl 复制代码

1234 pid
jmap -dump:format=b,file=/var/logs/heap.hprof 1234

2.有一点要注意导dump也不是万能的，也可能是别的系统影响了公用的第三方组件（例如跑不掉的数据库）
3.像系统因为内存不够挂掉的提前做配置项(内存溢出的时候自动导出dump
4.有了有问题的dump我们可以结合代码针对运行的线程，并再测试环境复现或者定位一些问题了。
5.慢的问题需要一个一个去看了比较哪个影响的比较大；
6.假死如何看系统，系统处理不过来了，为什么处理不过来了？单个系统支持的请求就那么多（线程池内能用的线程都被占用了排队等待的又不断涌入你说能不挂吗，重点关注下共性的卡顿点了)

7.通过这个图我们就可以理解限流防挂的意义了吧。

问题如何发现

1.提前防范只能监控告警（一般的监控系统）。
2.一切都是线程池，dynamictp提供线程池级别的监控。
3.因为我没做过互联网项目不知道是否每天有复盘排查慢的地方进行针对优化的
4.一般情况下库的问题比较直接些。数据库和、数据库中间件都有慢sql记录的隔一段时间优化下就可以了。
7.提前防范问题我们可以通过accesslog进行了，通过一定时间的访问记录我们可以知道哪些具体的业务是慢的，针对这个业务我们可以再通过arthas进行准确定位和修复。

上一篇：聊聊我的开源经历——先做个垃圾出来

下一篇：【Linux 并发与竞争实验】

热门推荐

01GitHub 镜像站点 02【AutoGLM部署】本地私有化部署AI手机Agent 03UV安装并设置国内源 04Open-AutoGLM Windows 安装部署教程 05Linux下V2Ray安装配置指南 06【超详细教程】手把手教你从微软官网免费下载Windows 10官方原版ISO镜像（2025最新版）07Cursor 又偷偷更新，这个功能太实用：Visual Editor for Cursor Browser 08安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）09BongoCat - 跨平台键盘猫动画工具 10Windows 11 官方系统安装与重装完整教程（2025年最新版）