一、什么是内存泄露?
内存溢出和内存泄露
- 内存泄漏(memoryleak):在Java中如果不再使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。
- 内存泄漏绝大多数情况都是由堆内存泄漏引起的,所以后续没有特别说明则讨论的都是堆内存泄漏。
- 内存泄漏(memoryleak):在Java中如果不再使用一个对象,但是该对象依然在GC ROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。
- 少量的内存泄漏可以容忍,但是如果发生持续的内存泄漏,就像滚雪球雪球越滚越大,不管有多大的内存迟早会被消耗完,最终导致的结果就是内存溢出。但是产生内存溢出并不是只有内存泄漏这一种原因。
内存泄露的常见场景
- 内存泄漏导致溢出的常见场景是大型的Java后端应用中,在处理用户的请求之后,没有及时将用户的数据删除。随着用户请求数量越来越多,内存泄漏的对象占满了堆内存最终导致内存溢出。
- 这种产生的内存溢出会直接导致用户请求无法处理,影响用户的正常使用。重启可以恢复应用使用,但是在运行一段时间之后依然会出现内存溢出
- 第二种常见场景是分布式任务调度系统如Elastic-job、Quartz等进行任务调度时,被调度的Java应用在调度任务结束中出现了内存泄漏,最终导致多次调度之后内存溢出。
- 这种产生的内存溢出会导致应用执行下次的调度任务执行。同样重启可以恢复应用使用,但是在调度执行一段时间之后依然会出现内存溢出
二、内存泄露的解决方案
解决内存溢出的步骤总共分为四个步骤,其中前两个步骤是最核心的:
发现问题---Top命令
- top命令是linux下用来查看系统信息的一个命令,它提供给我们去实时地去查看系统的资源,比如执行时的进程、线程和系统参数等信息。
- 进程使用的内存为RES(常驻内存)-SHR(共享内存)
优点:操作简单、无额外的软件安装
缺点:只能查看最基础的进程信息,无法查看到每个部分的内存占用(堆、方法区、堆外)
发现问题---VisuaIVM
- VisualVM是多功能合一的Java故障排除工具并且他是一款可视化工具,整合了命令行 JDK 工具和轻量级分析功能,功能非常强大。
- 这款软件在0racleJDK6~8中发布,但是在0racle JDK9之后不在JDK安装目录下需要单独下载。下载地址:https://visualvm.github.io/
优点:
功能丰富,实时监控CPU、内存、线程等详细信息
支持Idea插件,开发过程中也可以使用
缺点:
对大量集群化部署的java进程需要手动进行管理
发现问题--- Arthas
Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
优点:
功能强大,不止于监控基础的信息,还能监控单个方法的执行耗时等细节内容
支持应用的集群管理
缺点:
部分高级功能使用门槛较高
使用阿里arthas tunnel管理所有的需要监控的程序
背景:
小李的团队已经普及了arthas的使用,但是由于使用了微服务架构,生产环境上的应用数量非常多,使用arthas还得登录到每一台服务器上再去操作非常不方便。他看到官方文档上可以使用tunnel来管理所有需要监控的程序。
步骤:
1.在Spring Boot程序中添加arthas的依赖(支持Spring Boot2),在配置文件中添加tunnel服务端的地址,便于tunnel去监控所有的程序。
2.将tunnel服务端程序部署在某台服务器上并启动。
3.启动java程序
4.打开tunnel的服务端页面,查看所有的进程列表,并选择进程进行arthas的操作
发现问题--- Promethus+Grafana
- Prometheus+Grafana是企业中运维常用的监控方案,其中Prometheus用来采集系统或者应用的相关数据,同时具备告警功能。Grafana可以将Prometheus采集到的数据以可视化的方式进行展示。
- Java程序员要学会如何读懂Grafana展示的Java虚拟机相关的参数
优点:
- 支持系统级别和应用级别的监控,比如linux操作系统、Redis、MySQL、java进程。
- 支持告警并允许自定义告警指标、通过邮件、短信等方式尽早通知相关人员进行处理
缺点:
环境搭建较为复杂,一般由运维人员完成
堆内存状况的对比
正常情况
- 处理业务时会出现上下起伏业务对象频繁创建内存会升高,触发MinorGc之后内存会降下来。
- 手动执行FULL GC之后,内存大小会骤降,而且每次降完之后的大小是接近的。
- 长时间观察内存曲线应该是在一个范围内。
- 处于持续增长的情况,即时Minor Gc也不能把大部分对象回收
- 手动FULL GC之后的内存量每一次都在增长
- 长时间观察内存曲线持续增长
后面还会继续更新,谢谢大家的支持!!!