微观标记复制,整体上标记整理
假设堆被分成10个Region,每个Region用括号表示,里面是对象的状态:L表示存活对象,G表示垃圾,E表示空闲。
初始状态:堆中有存活对象和垃圾,分布比较零散。
Region: 0 1 2 3 4 5 6 7 8 9
L\] \[G\] \[L\] \[G\] \[E\] \[L\] \[G\] \[L\] \[G\] \[L
G1会选择一个回收集(比如Region1,3,6,8,这些Region的垃圾比例高)。注意,G1的选择是基于"回收价值"的,这里我们假设这几个Region的垃圾最多。
微观复制:将回收集(Region1,3,6,8)中的存活对象复制到空闲Region(比如Region4,但注意,复制过程中可能会使用多个空闲Region,这里为了简单,假设全部复制到Region4,实际上会按顺序使用空闲Region)。
复制后,回收集中的存活对象被复制到了新的Region,同时这些回收集被清空,变成空闲Region。
复制过程:
Region1: 没有存活对象(全是垃圾),所以直接清空,变成空闲。
Region3: 没有存活对象,直接清空。
Region6: 没有存活对象,直接清空。
Region8: 没有存活对象,直接清空。
实际上,如果有存活对象,就会复制到空闲Region。但在这个例子中,我们假设这些Region全是垃圾,所以没有复制操作,直接清空。
回收后的状态:
Region: 0 1 2 3 4 5 6 7 8 9
L\] \[E\] \[L\] \[E\] \[E\] \[L\] \[E\] \[L\] \[E\] \[L
现在,我们看到空闲Region变多了(1,3,6,8),而且它们是分散的。但是,请注意,存活对象仍然分散在0,2,5,7,9。
接下来,G1会继续选择回收集(比如Region0,2,5,7,9,假设它们现在垃圾比较多,但实际上这里存活对象多,垃圾少,所以可能不会选它们,这里为了演示整体整理的效果,我们假设又经过了多次回收,每次回收都选择垃圾最多的Region,并将存活对象复制到空闲Region)。
假设经过多次回收后,存活对象被逐渐复制到堆的一侧,空闲Region集中在另一侧。
最终状态可能如下:
Region: 0 1 2 3 4 5 6 7 8 9
L\] \[L\] \[L\] \[L\] \[L\] \[E\] \[E\] \[E\] \[E\] \[E
这样,我们就看到:整体上,存活对象被整理到了堆的前半部分,后半部分是大块连续的空闲空间。这就是整体上的标记-整理效果。
但是,这个整理过程不是一次完成的,而是通过多次的复制回收(微观复制)逐步完成的。
所以,总结一下:
微观:每次回收,将选中Region(回收集)的存活对象复制到空闲Region,然后清空回收集。这是复制算法。
整体:经过多次回收,存活对象被逐渐移动并紧凑地放在一起,形成连续的存活对象区域和连续的空闲区域。这是标记-整理的效果。
Region的堆内存布局
G1不再坚持固定大小以及固定数量的
分代区域划分,而是把连续的Java堆划分为多个大小相等的独立区域(Region),每一个Region都可以
根据需要,扮演新生代的Eden空间、Survivor空间,或者老年代空间
高吞吐量与低延迟的平衡
低延迟:指单次垃圾回收事件导致的"Stop-The-World"停顿时间非常短。
吞吐量指的是:应用程序运行时间占总运行时间的比例。
高吞吐量策略通常意味着:
- 更少的GC总时间(更多时间运行应用)
- 但可能单次停顿时间较长
低延迟策略通常意味着:
- 更短的每次停顿时间
- 但可能需要更频繁的GC,总GC时间可能增加

通过分区回收 + 停顿预测

可预测的停顿时间模型
优先处理回收价值收益最大的那些Region

四个步骤

总结
G1旨在为大内存、多核CPU的现代服务器应用提供可预测的、相对较短的停顿时间,同时保持较高的吞吐量,它通过Region化分区、停顿时间预测模型和增量式并发回收机制,在大堆内存管理上取得了吞吐量与延迟的最佳平衡。