G1回收器的工作机制

G1回收器的工作机制

G1(Garbage First)是JVM中一款里程碑式的垃圾回收器,它在Java 9成为默认GC。它的设计目标是:在可控的停顿时间内,尽可能高地实现吞吐量,同时避免CMS的碎片问题和传统分代GC的大停顿。


一、G1的核心设计思想

G1与传统分代GC最大的区别是:不再物理划分新生代和老年代,而是将整个堆划分为多个大小相等的Region

1. Region化堆内存

bash 复制代码
传统分代堆:
+-------------------------------+---------------------+
|           新生代              |       老年代         |
|  Eden | S0 | S1               |                      |
+-------------------------------+---------------------+

G1堆(逻辑上仍分代,但物理上混合):
+----+----+----+----+----+----+----+----+----+
| E  | O  | S  | H  | E  | O  | O  | E  | F  |
+----+----+----+----+----+----+----+----+----+
| O  | E  | S  | H  | O  | F  | E  | O  | S  |
+----+----+----+----+----+----+----+----+----+

E=Eden  S=Survivor  O=Old  H=Humongous(大对象)  F=Free(空闲)
  • Region大小 :通常为1MB-32MB之间(2的幂次方,通过-XX:G1HeapRegionSize设定),整个堆通常划分为约2048个Region。

  • 逻辑分代 :G1仍然区分年轻代和老年代,但它们是Region的动态集合,不是连续的内存块。

  • Humongous Region:大小超过Region容量50%的对象,存入专门的巨型Region,避免移动开销。

2. 停顿预测模型

G1的独特之处:它维护一个停顿预测模型,基于历史数据,可以预测在某个时间内(如200ms)能回收多少内存。

  • 可控停顿 :通过-XX:MaxGCPauseMillis设置期望最大停顿时间(默认200ms)。

  • 动态调整:G1会动态调整年轻代大小、回收策略,尽量满足此目标。


二、G1的工作阶段

G1将GC分为两大类:年轻代GC混合GC

1. 年轻代GC(Young GC)

触发条件:Eden区占满时触发。

工作流程

  1. 标记根对象:从GC Roots出发,找到存活对象。

  2. 复制存活对象:将Eden和Survivor中的存活对象,复制到新的Survivor Region或晋升到Old Region。

  3. 回收原Region:一次性清空原来的Eden和Survivor Region,变为空闲状态。

特点

  • 使用复制算法,无碎片。

  • **STW(Stop The World)**发生,但停顿时间通常很短(因为存活对象少)。

  • 完全并发的不多,但G1通过多线程并行复制来减少停顿。

bash 复制代码
初始状态:
[E] [E] [E] [S] [O] [O] [F] [F]

Young GC后:
[F] [F] [F] [S'] [O+] [O] [F] [F]
                 ↑
          新Survivor/晋升

2. 并发标记周期(Concurrent Marking Cycle)

这是G1最复杂的部分,不产生STW或者极小STW地标记出老年代中的存活对象,为后续的混合GC做准备。

包含多个子阶段

阶段1:初始标记(Initial Mark)- STW
  • 标记所有从GC Roots直接可达的对象。

  • 借机完成:通常在Young GC时顺带完成,代价很小。

阶段2:根区域扫描(Root Region Scan)
  • 扫描Survivor Region中指向老年代的引用。

  • 这个阶段是并发执行的(不暂停应用线程)。

阶段3:并发标记(Concurrent Mark)- 并发
  • 从GC Roots开始,并发地遍历整个堆的对象图,标记所有存活对象。

  • 这个过程对应用线程影响小,但可能产生浮动垃圾(标记过程中新产生的垃圾)。

阶段4:最终标记(Final Remark)- STW
  • STW,处理并发标记阶段遗漏的少量引用变更(通过SATB算法确保完整性)。

  • 相比CMS的最终标记,G1的效率更高。

阶段5:清理(Cleanup)- STW
  • 统计每个Region的存活对象数量和回收价值。

  • 不实际回收,只是标记哪些Region可以完全回收(存活对象为0)。

  • 根据停顿预测模型,按价值高低对Region排序,准备混合GC。

3. 混合GC(Mixed GC)

触发时机 :并发标记完成后,老年代占堆的比例达到阈值(-XX:InitiatingHeapOccupancyPercent,默认45%)。

核心特点不仅回收年轻代,还回收部分老年代Region

工作流程

  1. 选择Region集合(CSet):根据停顿预测模型,从高价值Region集合中,选出本次GC要回收的Region。包括:

    • 所有年轻代Region

    • 部分老年代Region(价值最高的那些)

  2. 复制存活对象

    • 将CSet中所有Region的存活对象,复制到其他空闲Region。

    • 这相当于一次全局复制,对象可能从年轻代到年轻代、年轻代到老年代、老年代到老年代。

  3. 回收原Region:清空整个CSet,释放大量内存。

多次执行 :一次并发标记周期后,可能会触发多次混合GC,每次回收一部分高价值老年代Region,直到老年代内存占用低于阈值。

bash 复制代码
并发标记后,按价值排序:
Region:  O5(价值高)  O3(价值高)  O8(价值中)  O2(价值低) ...
第一次混合GC:回收 O5, O3 + 所有年轻代Region
第二次混合GC:回收 O8 + 当前年轻代Region
...

4. Full GC

触发条件

  • 混合GC无法跟上对象分配速度(老年代增长太快)。

  • 巨型对象分配失败(Humongous Region无法找到连续空间)。

  • 并发标记周期失败。

后果最严重的STW,G1会退化到Serial Old算法,单线程进行全堆标记-整理-压缩。

目标:通过调优参数,尽量避免Full GC发生。


三、G1的关键技术点

1. SATB(Snapshot-At-The-Beginning)

G1在并发标记开始时,会对对象图拍一个"逻辑快照"。标记过程中,即使引用发生变化(比如删除了某个引用),G1仍然会保留该引用指向的对象为"存活"。

优点 :避免CMS中复杂的增量更新,实现简单。

代价 :可能产生浮动垃圾(本应回收但被保留的对象),需要后续GC处理。

2. Remembered Set(RSet)

每个Region内部维护一个RSet,记录哪些Region引用了本Region中的对象

bash 复制代码
Region A中的对象obj被Region B和Region C引用
Region A的RSet = [B, C]

作用

  • Young GC时,不需要扫描整个堆,只需扫描RSet中记录的Region。

  • 实现并行化分代独立回收

维护开销:写屏障(Write Barrier)在引用赋值时更新RSet,略有性能损耗。

3. 停顿预测模型

G1维护一个历史数据库,记录每次GC的:

  • Region扫描时间

  • 对象复制时间

  • 更新RSet时间

基于这些数据,建立一个线性回归模型,预测回收N个Region需要的时间,从而在制定CSet时做到"停顿可控"。


四、G1 vs CMS vs Parallel GC

特性 G1 CMS Parallel GC
设计目标 可控停顿时间 低停顿 高吞吐量
堆布局 Region化 连续分代 连续分代
内存碎片 无(复制+整理) 有(标记-清除) 无(整理)
停顿时间 可预测(默认200ms) 较低 较高(Full GC很长)
吞吐量 中等 较低 最高
内存开销 较高(RSet占5%-10%) 中等
适用场景 大堆(4GB+)、响应重要 中堆、响应重要 高吞吐、可接受停顿

选择建议

  • G1:堆 > 4GB,期望停顿 < 1秒,Java 9+默认。

  • Parallel GC:堆 < 4GB,或吞吐优先(如批处理)。

  • ZGC:堆 > 32GB,期望停顿 < 10ms(Java 11+)。


五、G1调优示例

bash 复制代码
# 设置期望最大停顿时间(G1会尽量满足)
-XX:MaxGCPauseMillis=200

# 设置堆大小和Region大小
-Xmx8g
-XX:G1HeapRegionSize=16m

# 触发混合GC的堆占用阈值(避免过早/过晚)
-XX:InitiatingHeapOccupancyPercent=45

# 并行线程数
-XX:ParallelGCThreads=8
-XX:ConcGCThreads=2

# 启用G1日志
-Xlog:gc*:file=g1-gc.log:time,level,tags

调优方向

  1. 停顿时间设置不当:太短(<50ms)可能频繁GC,太长(>500ms)可能失去G1意义。

  2. Humongous对象问题:大量大对象会直接进入老年代,加速Full GC。可以通过调整Region大小或代码优化解决。

  3. RSet内存占用:G1的RSet可能占堆内存5%-10%,避免过多跨Region引用。

相关推荐
砍材农夫1 小时前
物联网实战:Spring Boot + Netty 搭建 MQTT平台 | 多协议适配与模块化设计
java·spring boot·后端·物联网·spring
填满你的记忆1 小时前
JVM 面试题 Top40
jvm·面试题
云烟成雨TD1 小时前
Spring AI 1.x 系列【41】接入高德 MCP 服务
java·人工智能·spring
winlife_2 小时前
全程用 AI 做一款商业级手游 · EP7 表现层与手感:从“能跑“到“摸起来爽“
java·开发语言·人工智能·unity·ai编程·游戏开发·mcp
千纸鹤の脉搏2 小时前
多线程的初步使用
java·开发语言·学习·多线程
故渊at2 小时前
第二板块:Android 四大组件标准化学理 | 第十篇:ContentProvider 数据共享与 SQLite 引擎
android·jvm·数据库·sqlite·contentprovider
一个儒雅随和的男子2 小时前
MQTT常见的问题?
java
Mr.45672 小时前
Netty中实现设备消息串行处理:Semaphore + 线程池
java·后端
2601_961194022 小时前
考研资料电子版|下载|pdf
java·python·考研·eclipse·django·pdf·pygame