GC 怎么判定“该回收谁”:GC Roots、可达性分析、四种引用与回收算法

很多人学 GC 的痛点是:

  • 名词一堆:标记清除、复制、标记整理、分代
  • 但一旦你真遇到"内存回不去",你又不知道该从哪里解释

这篇把 GC 的主线拆成两条:

  • 先判定谁活谁死(可达性分析)
  • 再决定怎么回收(算法/策略)

1. 为什么 JVM 不用引用计数:循环引用是天坑

引用计数思路:

  • 每个对象维护引用次数
  • 变成 0 就回收

问题:

  • 两个对象互相引用,引用次数永远不为 0,但它们可能已经"不可达"

所以 HotSpot 主流使用:

  • 可达性分析(Reachability Analysis)

2. 可达性分析:从 GC Roots 出发,能走到就是活

核心规则:

  • 从一组根对象(GC Roots)出发遍历对象图
  • 能到达的对象都是存活
  • 到达不了的对象就是垃圾

2.1 常见 GC Roots 你至少要认识

  • 线程栈中的引用(局部变量表)
  • 静态变量引用(被类持有的引用)
  • JNI 引用(本地方法栈)
  • 运行中的线程对象、Class 对象等(不同实现有差异)

这也是为什么:

  • 静态集合很容易造成"你以为没用了但其实一直活着"

3. 回收算法:标记清除 / 复制 / 标记整理

3.1 标记清除(Mark-Sweep)

  • 标记出要回收的对象
  • 直接清除

问题:

  • 产生碎片

3.2 复制算法(Copying)

  • 把存活对象复制到另一块连续空间
  • 直接清理整块旧空间

特点:

  • 回收快、无碎片
  • 需要额外空间

常见用法:

  • 新生代(对象存活率低,复制成本低)

3.3 标记整理(Mark-Compact)

  • 标记存活对象
  • 把存活对象往一侧挪,整理成连续空间

特点:

  • 减少碎片
  • 整理有成本

常见用法:

  • 老年代(存活率高,复制成本高)

4. 分代收集:不是算法,是"策略组合"

分代思想来自经验:

  • 大多数对象活不久

所以:

  • 新生代:复制/快速回收
  • 老年代:标记整理(或标记清除 + 处理碎片)

5. 四种引用:为什么你"以为能回收"但没回收

5.1 强引用

  • 默认写法就是强引用
  • 只要强引用还在,通常不会回收

5.2 软引用(SoftReference

  • 内存紧张时才回收
  • 常用于缓存,但别把它当万能缓存方案

5.3 弱引用(WeakReference

  • 下一次 GC 就可能被回收
  • 常见场景:弱引用缓存、ThreadLocal 的 key

5.4 虚引用(PhantomReference

  • 不影响对象生命周期
  • 常用于"对象被回收前做通知/资源清理"这类高级用法

6. 把这些知识落到排障:你该如何解释"内存回不去"

你遇到"Full GC 后内存回不去",你可以按这个顺序解释:

  • 先确认:是不是有 GC Roots 在引用(静态集合/线程栈/ThreadLocal)
  • 再确认:存活对象是否真的很多(业务缓存/大对象)
  • 最后用 heapdump + MAT 找到引用链

7. 总结

  • HotSpot 主要用可达性分析,从 GC Roots 出发判定存活
  • 回收算法:标记清除(碎片)/复制(快)/标记整理(少碎片)
  • 分代是策略组合:新生代与老年代采用不同回收方式
  • 四种引用决定"对象在不同内存压力下是否会被回收"
相关推荐
终将老去的穷苦程序员7 小时前
基于Android Studio开发的安卓图书借阅管理系统
java·sqlite·android studio·android-studio
code_pgf8 小时前
改进模型架构来减少MLLMs中的幻觉现象
人工智能·深度学习·算法
技术小结-李爽8 小时前
【工具】Maven的使用
java·maven
2301_764441338 小时前
基于AI的本地文件归档智能管理工具梳理
人工智能·python·算法·目标检测·交互
sou_time8 小时前
从 0 到 商用:AI Agent x SKILL x MCP 全栈实战教程:L2 高等篇:MCP 协议 + Spring AI + Agent 编排
java·人工智能·spring
冷小鱼8 小时前
高级研发编码习惯:从规范到艺术,再到AI+时代的人机协同
java·开发语言·python·编码习惯
无限码力8 小时前
美团研发岗 4月18号笔试真题 - 包包的最长公共子序列3
算法·美团笔试题·美团研发岗笔试题·美团机试题
齐 飞8 小时前
JDK21虚拟线程
java·后端
小马爱打代码8 小时前
Java 并发 Bug 深度分析与实战
java
阿里matlab建模师8 小时前
基于matlab时域频域处理的语音信号变声处理系统设计与算法原理(论文+程序源码+GUI图形用户界面)——变声算法
算法·matlab·语音识别