什么是跨代引用?
在 G1 GC(以及其他分代 GC)中,堆被逻辑上分为:
- 年轻代(Young Generation) :Eden + Survivor(S 区)
- 老年代(Old Generation)
而在 G1 中,这两部分又进一步被拆分为多个 Region(区域),每个 Region 可能属于年轻代或老年代。
所谓的 跨代引用(Cross-Generational Reference) 就是:
老年代对象中,引用了年轻代对象。

为什么"跨代引用"是个问题?
垃圾回收时,Minor GC(或 Young Collection) 只扫描年轻代区域(Eden + Survivor)。
如果年轻代里有对象被老年代引用,那么这个对象必须保留(不能被错误地回收)。
问题在于:
- 老年代对象太多;
- 如果每次年轻代 GC 都去全量扫描老年代,会导致性能灾难。
G1 的解决方案
记忆集 & 卡表
cloud.tencent.com/developer/a...
记忆集是一种抽象概念,用于在实现部分垃圾收集(Partial GC)时用于记录从非收集区域指向收集区域的指针集合,卡表是记忆集的一种实现方式。例如在分代式GC中,通常能单独收集的只有Yong gen,那记忆集记录的就是Old gen指向Young gen的跨代指针。

在HotSpot中,采用卡表去实现记忆集。可以把记忆集和卡表的关系理解为Map跟HashMap。  一个卡页的内存中通常包含不止一个对象,只要卡页内有一个(或更多)对象的字段存在着跨代指针,那就将对应卡表的数组元素的值标识为1,成这个元素变脏(Dirty),没有则标识为0。在垃圾收集发生时,只要筛选出卡表中变脏的元素,就能轻易得出哪些卡页内存块中包含跨代指针,把他们加入GC Roots中一并扫描。
 一个卡页的内存中通常包含不止一个对象,只要卡页内有一个(或更多)对象的字段存在着跨代指针,那就将对应卡表的数组元素的值标识为1,成这个元素变脏(Dirty),没有则标识为0。在垃圾收集发生时,只要筛选出卡表中变脏的元素,就能轻易得出哪些卡页内存块中包含跨代指针,把他们加入GC Roots中一并扫描。
