一、引言

垃圾回收对于Javaer来说是一个绕不开的话题，工作中涉及到的调优工作也经常围绕垃圾回收器展开。面对不同的业务场景没有一个统一的垃圾回收器能保证可GC性能。因此对程序员来说不仅要会编写业务代码，同时也要卷一下JVM底层原理和调优知识。这种局面可能因为ZGC的出现而发生改变，新一代回收器ZGC几乎不需要调优的情况下GC停顿时间可以降低到亚秒级。

Oracle从JDK11开始正式引入ZGC，ZGC设计三大目标：

支持TB级内存 (8M~4TB) 。
停顿时间控制在10ms之内 (生产环境实际观测在微秒级) ，停顿不会随着堆的大小，或者活跃对象的大小而增加。
对程序吞吐量影响小于15%。

ZGC是如何设计怎么达到这个目标的呢？本文将从ZGC算法的关键特性入手，通过分析ZGC周期处理过程来理解这些特性，探索ZGC设计思想。

二、ZGC术语

非分代：将对内存划分为新生代和老年代 (G1已经逻辑分代) ，ZGC取消分代设计，每个GC周期都将标记整个堆中的所有活动对象。

页面： ZGC将堆空间分解成一块块区域，这些区域叫做页面，ZGC通过页面来回收内存。

并发性： GC和线程和业务线程同时运行。 ZGC的高度并发设计，几乎所有GC工作、标记和堆碎片整理都是和业务线程 (mutators) 同时运行的，只包含了短暂的STW同步暂停。

并行： 多个线程进行GC线程同时工作，加快回收速度。

标记-复制算法： 标记-复制算法主要包括以下3个过程。

标记阶段，即从GC Roots集合开始，分析对象可达性，标记出活跃对象。

图1：可达性分析后对象的引用状态

对象转移阶段，即把活跃对象复制到新的内存地址上。
重定位阶段，因为转移导致对象的地址发生了变化，在重定位阶段，所有指向对象旧地址的指针都要调整到对象新的地址上。

标记-复制算法的最大优势就是防止堆内存碎片化的出现，复制的过程就可以对堆内存进行整理。ZGC、CMS和G1都是采用了标记-复制算法，但是不同的实现导致了很大的性能差异。

三、ZGC性能数据

ZGC设计致力于提供几毫秒的最大暂停时间，同时保证吞吐量不受影响。下面是SPECjbb2015针对OpenJDK中的不同收集器运行的性能测试数据。在128G堆内存下，无论是延迟还是吞吐量上面ZGC的性能表现都高于其他收集器。

图2：SPECjbb2015GC性能评分

图3: SPECjbb2015GC延迟比较

四、ZGC关键特性

ZGC的周期是高度并发的，并发性越高意味着GC工作时对业务线程的影响越小，SPECjbb2015的性能报告可以看出ZGC在延迟上比G1低10倍以上，ZGC的工作周期只有三个阶段是STW的，其他阶段完全并发。这得益于ZGC在堆视图并发一致性设计上的改进。我们都清楚在并发的场景下需要协调各个线程对共享资源达成一致性，常用的手段就是对资源加锁，而在垃圾回收器下的思路也是类似，如果GC线程工作是需要锁定对象资源进行处理，业务线程则需要全部暂停，这就产生了STW (Stop The Word) 。以往的垃圾回收器都是让GC线程和业务线程就堆中对象地址达成一致，对象在发生转移时业务线程是不能访问的 (因为对象的地址发生了变化) ，无论G1还是CMS对象在进行复制时都是需要STW。ZGC使用到的着色指针（Colored Pointer）和读屏障（Load Barrier）技术，可以让所有线程在并发的条件下就指针的颜色 (状态) 达成一致，而不是对象地址。因此，ZGC可以并发的复制对象，这大大的降低了GC的停顿时间。我们先对着色指针和读屏障有个初步的理解，然后在通过ZGC回收周期来看这2项技术的具体运用。

着色指针(Colored Pointer)

在指针中嵌入元数据（使用地址中的高阶位来实现），这种通过在指针存储元数据的技术就叫做着色指针 (Colored Pointer) 。ZGC中指针始终是64位结构，由元位（指针的颜色）和地址位组成。地址位数决定了理论上支持的最大堆大小，ZGC使用42位存储地址也就意味着ZGC最大支持4TB堆内存。如图所示，低42位是地址位，中间4位是元位，高18位未使用。四个元位是Finalized ( F )、Remapped ( R )、Marked1 ( M1 ) 和Marked0 ( M0 )。

图4: 64位地址使用示意图

ZGC中将指定上的标记通过颜色来表示，颜色可以是"good" (地址有效) 或"bad" (地址可能无效) 。指针的颜色由其元位的状态决定：F、R、M1和M0。"good"是R、M1、M0元位中的一个被设置，另外三个未设置，比如0100、0010和 0001属于"good"颜色。通过在指针上的颜色就能区分出对象状态，不用额外做内存访问，这使得ZGC在标记和转移阶段会更快。

通过设置地址元位的状态，可以形成不同地址视图，ZGC同一物理堆内存被映射到虚拟地址空间三次，从而产生同一物理内存的三个"视图"，GC活动的不同时期会只存在一个活跃视图，根据垃圾回收的周期ZGC通过切换不同视图标来记出对象的颜色。

下图是虚拟地址的空间划分：

图5：虚拟地址空间划分和多视图映射

ZGC关键技术分析

一、引言

二、ZGC术语

三、ZGC性能数据

四、ZGC关键特性

着色指针(Colored Pointer)