G1数据结构

‌G1垃圾回收算法的内部结构‌以"化整为零"的分区思想为核心,将整个Java堆划分为多个大小相等的独立区域(Region),每个Region大小通常为1~32MB(2的幂次方),由JVM根据堆大小自动设定 。这种结构打破了传统垃圾回收器对堆内存的固定分代布局,实现了更灵活、高效的内存管理。

一、Region:G1的基本单位

G1将堆内存划分为‌多个固定大小的Region‌,每个Region在运行时可动态扮演不同角色:

  • E Eden区‌:存放新创建的对象。
  • S Survivor区‌:存放经过一次Young GC后仍存活的对象。
  • O Old区‌:存放长期存活或从年轻代晋升的对象。
  • H Humongous区‌:专门用于存储大对象(大小超过Region容量一半的对象) 。
    例如,在一个4GB堆、Region大小为2MB的配置下,任何超过1MB的对象都会被直接分配到Humongous Region中 。
    这种动态角色分配机制使得G1能根据应用行为灵活调整内存布局,避免了传统分代回收器中年轻代与老年代比例固定的僵化问题。

二、关键数据结构与机制

1. ‌Remembered Set(RSet,记忆集)

每个Region都维护一个RSet,用于记录‌其他Region中对象对该Region的引用关系‌

在进行年轻代回收(Young GC)时,G1无需扫描整个老年代来判断跨代引用,只需扫描RSet中记录的引用即可,极大提升了效率 。

2. ‌Card Table(卡表)

‌RSet的底层实现依赖于‌卡表(Card Table)‌。堆内存被划分为若干个512字节的"卡(Card)",每个卡对应卡表中的一个字节。当发生跨Region引用时,相应卡被标记为"脏卡(Dirty Card)",后续通过扫描脏卡来更新RSet 。

可以理解为:‌Card Table是RSet的数据来源,RSet是G1实现高效跨代引用处理的核心机制‌

3. ‌SATB(Snapshot-At-The-Beginning)

在并发标记阶段,为保证标记准确性,G1采用SATB算法。它在标记开始时记录堆的逻辑快照,任何在并发期间被修改或删除的对象引用,都会通过写屏障(Write Barrier)记录到队列中,供最终标记阶段处理,防止漏标 。

‌4. ‌TAMS(Top at Mark Start)指针

为支持并发标记期间的新对象分配,G1为每个Region设置了两个TAMS指针(Previous和Next),划分出用于记录并发阶段新分配对象的空间。这些对象默认被视为"已存活",不参与本次标记过程 。

三、回收流程与阶段划分

G1的回收周期主要包括以下阶段:
1‌. Young GC‌ :当Eden区满时触发,STW暂停,复制存活对象到Survivor或Old区。
‌2. 并发标记(Concurrent Marking)‌ :当堆占用达到阈值(默认45%)时启动,标记整个堆的存活对象。
‌3. Mixed GC‌ :在并发标记完成后,优先回收垃圾比例高的Region,包括部分老年代。
4‌. Full GC‌:极端情况下(如空间不足或碎片严重)触发,单线程执行,应尽量避免

相关推荐
Darling噜啦啦6 天前
列表转树算法深度解析:从 Map 到 Reduce 的两种实现,面试高频考点
数据结构·算法·面试
小小工匠7 天前
Redis - 事务机制:能实现 ACID 属性吗
数据结构·redis·性能优化·并发·持久化
玖玥拾7 天前
C/C++ 数据结构(七)栈、容器适配器
c语言·数据结构·c++··容器适配器
Qres8217 天前
算法复键——树状数组
数据结构·算法
牛油果子哥q7 天前
并查集(DSU)超精讲,路径压缩、按秩合并、万能模板、连通性判定、最小生成树与刷题实战全解
数据结构·c++·最小生成树·并查集
凌波粒7 天前
LeetCode--491.递增子序列(回溯算法)
数据结构·算法·leetcode
WL学习笔记7 天前
单项不带头不循环链表
数据结构·链表
小糯米6017 天前
JS 数组
数据结构·算法·排序算法
小欣加油7 天前
leetcode3612 用特殊操作处理字符串I
数据结构·c++·算法·leetcode·职场和发展
凌波粒7 天前
LeetCode--90.子集II(回溯算法)
数据结构·算法·leetcode