常见JVM参数配置和GC性能优化

常见的JVM参数配置

垃圾回收统计信息

-XX:+PrintGC 打印GC简要信息

-XX:+PrintGCDetails打印GC的详细信息

-XX:+PrintGCTimeStamps打印CG发生的时间戳

-Xloggc:log/gc.log 指定GC log的位置，以文件输出

-XX:+PrintHeapAtGC 每一次GC前和GC后，都打印堆信息。

堆设置

-Xms：初始堆大，最小堆

-Xmx：最大堆大小

-Xmn：设置新生代的大小

-XX:NewRatio新生代和年老代的比值，如为3，表示年轻代与年老代比值为1：3，年轻代占整个年轻代年老代之和的1/4

-XX:SurvivorRatio设置两个Survivor区和eden的比值。注意Survivor区有两个。如：8，表示Eden：Survivor=8：2，一个Survivor区占整个年轻代的1/10

-XX:PermSize：设置永久区的初始空间

-XX:MaxPermSize：设置永久区的最大空间。

-XX:+MaxTenuringThreshold=10：新生代垃圾的最大年龄，代表对象在Survivor区经过10次复制以后才进入老年代。如果设置为0，则年轻代对象不经过Survivor区，直接进入老年代。

-XX:+PretenureSizeThreshold：设置大对象直接进入老年代的阈值。当对象的大小超过这个值时，将直接在老年代分配。

栈的分配参数

-Xss：设置栈空间的大小

垃圾 收集器设置

串行收集器的设置

-XX:+UseSerialGC:设置串行收集器，一般适用于小型应用和单处理器，算法比较简单，GC效率也较高，但可能会给应用带来停顿。

并行回收收集器设置(ParallelGC收集器的目标是达到一个可控制的吞吐量)

-XX:+UseParNewGC：设置年轻代为并行收集。

-XX:+UseParallelGC:设置年轻代使用并行回收收集器。多个线程并行执行GC，一般适用于多处理器系统中，可以提高GC的效率，但算法复杂，系统消耗较大。

-XX:+UseParalledlOldGC:设置老年代为并行回收收集器，Java1.6之后才出现。

-XX:ParallelGCThreads=n:设置并行收集器收集时使用的线程数，最好与CPU数目相等。

-XX:MaxGCPauseMillis=n:设置年轻代每次并行垃圾回收的最大暂停时间。

-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)

-XX:+UseAdaptiveSizePolicy：自适应策略，自动选择年轻代区大小和相应的Survivor区比例。

CMS并发收集器(以最短停顿为目标)

-XX:+UseConcMarkSweepGC：使用CMS内存收集。

-XX:+ParallelCMSThreads: 设定 CMS 的线程数量。

-XX:CMSFullGCsBeforeCompaction：CMS多少次后进行内存压缩，由于并发收集器不对内存空间进行压缩整理，所以运行一段时间以后会产生"碎片",使得运行效率降低。

-XX:+UseCMSCompactAtFullCollection：在FULL GC的时候，对年老代的压缩。CMS是不会移动内存的，因此，这个非常容易产生碎片，导致内存不够用，因此，内存的压缩这个时候就会被启用。可能会影响性能,但是可以消除碎片。

-XX:+CMSInitiatingOccupancyFraction:设置 CMS 收集器在老年代空间被使用多少后触发，默认为 68%。

-XX:+CMSClassUnloadingEnabled:允许对类元数据进行回收。

-XX:+CMSParallelRemarkEndable:启用并行重标记。

-XX:CMSInitatingPermOccupancyFraction:当永久区占用率达到这一百分比后，启动 CMS 回收 (前提是-XX:+CMSClassUnloadingEnabled 激活了)。

-XX:UseCMSInitatingOccupancyOnly:表示只在到达阈值的时候，才进行 CMS 回收。

-XX:+CMSIncrementalMode:使用增量模式，比较适合单 CPU。

G1收集器

-XX:+UseG1GC：使用 G1 回收器。

-XX:+UnlockExperimentalVMOptions:允许使用实验性参数。

-XX:+MaxGCPauseMills:设置最大垃圾收集停顿时间。

-XX:+GCPauseIntervalMills:设置停顿间隔时间。

JVM的GC性能优化

对于GC的性能主要有2个方面的指标：吞吐量(工作时间不算，gc的时间占总的时间比)和暂停时间。

堆大小

默认情况下，vm会增加/减少heap大小以维持free space在整个vm中占的比例，这个比例由MinHeapFreeRatio和MaxHeapFreeRatio指定。

一般而言，server端的app会有以下规则：

（1）对vm分配尽可能多的内存；

（2）将Xms和Xmx设为一样的值。如果虚拟机启动时设置使用的内存比较小，这个时候又需要初始化很多对象，虚拟机就必须重复地增加内存。

（3）处理器核数增加，内存也跟着增大。

年轻代

（1）对于程序流畅性运行影响的因素是新生代的大小。新生代越大，minor collection越少；但是在堆大小固定情况下，新生代越大就意味着越小的老年代，就意味着更多的major collection。

（2）8NewRatio反映的是新生代和老年代的大小比例。NewSize和MaxNewSize反映的是young generation大小的下限和上限，将这两个值设为一样就固定了young generation的大小（同Xms和Xmx设为一样）。

（3）SurvivorRatio也可以优化survivor的大小，不过这对于性能的影响不是很大。SurvivorRatio是Eden和Survior大小比例。

一般而言，server端的app会有以下规则：

（1）首先决定能分配给vm的最大的堆大小，然后设定最佳的young generation的大小；

（2）如果堆大小固定后，增加新生代的大小意味着减小老年代大小。让老年代在任何时候够大，能够容纳所有存活的对象（留10%-20%的空余）。

年轻代大小选择

（1）响应时间优先的应用：尽可能设大，直到接近系统的最低响应时间限制，在此种情况下，年轻代收集发生的频率也是最小的，同时,减少到达年老代的对象。

（2）吞吐量优先的应用：尽可能的设置大，可能到达Gbit的程度，因为对响应时间没有要求，垃圾收集可以并行进行，一般适合8CPU以上的应用。

（3）避免设置过小。当新生代设置过小时会导致：①YGC次数更加频繁；②可能导致YGC对象直接进入旧生代，如果此时旧生代满了，会触发FGC。

老年代大小选择

（1）响应时间优先的应用：年老代使用并发收集器。如果堆设置小了，可以会造成内存碎片、高回收频率以及应用暂停而使用传统的标记清除方式；如果堆大了，则需要较长的收集时间。一般需要参考以下数据：

并发垃圾收集信息、持久代并发收集次数、传统GC信息、花在年轻代和年老代回收上的时间比例。

（2）吞吐量优先的应用:一般吞吐量优先的应用都有一个很大的年轻代和一个较小的年老代，这样可以尽可能回收掉大部分短期对象，减少中期的对象，而年老代尽存放长期存活对象。

较小堆引起的碎片问题

因为CMS年老代的并发收集器使用标记清除算法 ， 所以不会对堆进行压缩 **。**当收集器回收时，它会把相邻的空间进行合并,这样可以分配给较大的对象。但是，当堆空间较小时，运行一段时间以后，就会出现"碎片"，如果并发收集器找不到足够的空间，那么并发收集器将会停止，可能需要进行如下配置：

-XX:+UseCMSCompactAtFullCollection：使用并发收集器时，开启对年老代的压缩。

-XX:CMSFullGCsBeforeCompaction=0：上面配置开启的情况下，这里设置多少次Full GC后，对年老代进行压缩。

其他说明

（1）用64位操作系统，Linux下64位的jdk比32位jdk要慢一些，但是吃得内存更多，吞吐量更大

（2）XMX和XMS设置一样大，MaxPermSize和MinPermSize设置一样大，这样可以减轻伸缩堆大小带来的压力

（3）CMS的目标是最短的GC停顿时间，使用CMS的好处是用尽量少的新生代，然后老生代利用CMS并行收集，这样能保证系统低延迟的吞吐效率

（4）系统停顿的时候可能是GC的问题也可能是程序的问题，多用jmap和jstack查看，或者killall -3 java，然后查看java控制台日志，能看出很多问题

（5）如果用了缓存，那么年老代应该大一些，缓存的HashMap不应该无限制长，建议采用LRU算法的Map做缓存，LRUMap的最大长度也要根据实际情况设定

（6）采用并发回收时，年轻代小一点，年老代要大，因为年老代用的是并发回收，即使时间长点也不会影响其他程序继续运行，网站不会停顿

（7）JVM参数的设置(特别是 --Xmx --Xms --Xmn -XX:SurvivorRatio -XX:MaxTenuringThreshold等参数的设置)没有一个固定的公式，需要根据PV old区实际数据、YGC次数等多方面来衡量。为了避免promotion faild可能会导致xmn设置偏小，也意味着YGC的次数会增多，处理并发访问的能力下降等问题。每个参数的调整都需要经过详细的性能测试，才能找到特定应用的最佳配置。

promotion failed: （晋升失败）

垃圾回收时promotion failed，一般可能是两种原因产生，第一个原因是To survivor救助空间不够，救助空间里的对象还不应该被移动到年老代，但年轻代又有很多对象需要放入救助空间；第二个原因是年老代没有足够的空间接纳来自年轻代的对象；这两种情况都会转向Full GC，网站停顿时间较长。

解决方案：

第一个原因解决办法是去掉救助空间，设置-XX:SurvivorRatio=65536 -XX:MaxTenuringThreshold=0即可，但是因为没有用到救助空间，所以年老代容易满，Full GC执行会比较频繁，所以可以把救助空间加大，这样也不会有promotion failed。
第二个原因我的解决办法是设置CMSInitiatingOccupancyFraction为某个值（假设70），这样年老代空间到70%时就开始执行CMS，年老代有足够的空间接纳来自年轻代的对象。

实际编程中的性能优化

下面是一些在实际写程序的过程中应该注意的点：养成这些习惯可以在一定程度上减少内存的无谓消耗，进一步就可以减少因为内存不足导致GC不断。

（1）减少new对象。每次new对象之后，都要开辟新的内存空间。这些对象不被引用之后，还要回收掉。因此，如果最大限度地合理重用对象，或者使用基本数据类型替代对象，都有助于节省内存；

（2）多使用局部变量，减少使用静态变量。局部变量被创建在栈中，存取速度快。静态变量则是在堆内存；

（3）避免使用finalize，该方法会给GC增添很大的负担；

（4）如果是单线程，尽量使用非多线程安全的，因为线程安全来自于同步机制，同步机制会降低性能。例如，单线程程序，能使用HashMap，就不要用HashTable。同理，尽量减少使用synchronized

（5）用移位符号替代乘除号。eg：a*8应该写作a<<3

（6）对于经常反复使用的对象使用缓存；

（7）尽量使用基本类型而不是包装类型，尽量使用一维数组而不是二维数组；

（8）尽量使用final修饰符，final表示不可修改，访问效率高；

（9）单线程情况下（或者是针对于局部变量），字符串尽量使用StringBuilder，比StringBuffer要快；

（10）String为什么慢？因为String 是不可变的对象, 因此在每次对 String 类型进行改变的时候其实都等同于生成了一个新的 String 对象，然后将指针指向新的 String 对象。如果不能保证线程安全，尽量使用StringBuffer来连接字符串。这里需要注意的是，StringBuffer的默认缓存容量是16个字符，如果超过16，apend方法调用私有的expandCapacity()方法，来保证足够的缓存容量。因此，如果可以预设StringBuffer的容量，避免append再去扩展容量。如果可以保证线程安全，就是用StringBuilder。