JVM知识点（二）

1、G1垃圾收集器

-XX:MaxGCPauseMillis=10，G1的参数，表示在任意1s时间内，停顿时间不能超过10ms；
G1将堆切分成很多小堆区（Region），每一个Region可以是Eden、Survivor或Old区；这些区在内存上不是连续存放的；
每一块Region大小都是相同的，大小为1-32M，若Region对象存储不下，大小超过Region50%的对象，将会存放到Humongous Region；
-XX:G1HeapRegionSize，可以调整Region大小；
-XX:G1HeapWastePercent：可以调整GC回收的阈值，默认为5%；只有达到这个阈值，GC才会回收对象，避免GC花费大量时间，回收内存却比较少；

垃圾回收过程：

G1"年轻代对象回收"，即Minor GC，发生时机为Eden满；
老年代垃圾收集，他是一个并发标记过程，会顺便清理一点对象；
混合清理，会同时清除年轻代和老年代对象；

RSet：

RSet记录的其他Region对象应用本Region对象的关系，是一个hash结构，key为引用的Region的地址，value为应用本Region的对象卡页集合；
有了该结构，回收对象时，不必堆整个堆内存对象进行扫描；
RSet占用空间较大，通常为5%；

2、高并发下估算和调优

（1）GC考量指标

系统容量：机器上的资源容量，资源容量限制比较严格的系统，对他的优化会越明显；
吞吐量：在一个时间段内完成多少事务操作；
延迟：等待时间；如查询一条sql，返回数据所等待时间；

（2）选择垃圾收集器

堆大小空间不是很大（如100MB），使用串行收集器效果最好，XX：+UseSerialGC；
如果机器为单核CPU，选择串行收集器较好；
如果应用为"吞吐优先"，并且堆停顿时间没有要求，使用并行收集器合适，XX:+UseParallelGC；
如果应用对响应时间要求较高，使用G1，CMS，ZGC较为合适，-XX:+UseConcMarkSweepGC、-XX:+UseG1GC、-XX:+UseZGC ，但会额外使用资源处理；

（3）大流量应用特点

对延迟非常敏感的应用，通常可以通过机器集群来解决；
考量系统指标有：

- TPS：每秒处理的事务数量；
- AVG：平均响应时间；
- TP：表示机器有多少请求响应时间小于x毫秒；如TP80，代表有80%的请求响应时间小于x毫秒；

（4）估算

假设高峰请求6w/s，共有10台机器，每个请求大小20k，则每台机器JVM的流量为120MB/s

（5）调优

假设给JVM分配了5460MB空间，则年轻代占用空间为5460/3=1820MB，Eden区大小大约为1820/10*8=1456MB,按照上面估算的120MB/s的流量，大约12s需要发生一次Minor GC；
每隔半小时，会发送一次Major GC，Survivor区大小为182MB，若幸存下来的对象大于Survivor区内存大小，则会将对象直接分配到Old区，这样导致垃圾存储时间更长，只有Old区满了才能清除；
大部分对象存活时间短，在Eden区发生GC后，会回收大量对象，我们可以分配一半的空间给Eden区，通过配置-XX:+UseConcMarkSweepGC -Xmx5460M -Xms5460M -Xmn2730M，Eden区发生GC时间为2730/10*8/120=18s；
调大年轻代，顺便调大幸村去，这样对象在年轻代存活时间越大；
元空间在扩容时，会发生Full GC，默认大小为20MB，可以通过参数- -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M将其调大，减少发生Full GC；

3、OOM问题排查

（1）分析那个线程影响CPU

使用top命令查询占用CPU最多的线程，记录其pid，shitf+p可以按照CPU使用率进行排序；
使用 top -H -p <pid> 查看进程中哪个线程占用CPU最高，记录线程id；
将十进制是tid转换为16进制，printf %x <tid>；
将线程栈信息输入到文件，jstack <tid> > <tid.log>;
查看日志信息 less <tid.log>；

（2）内存泄漏

内存溢出是结果，内存泄漏是一个原因；
不再被使用的对象，没有被切断和GC root链接，会导致内存泄漏；
使用hashmap缓存数据时，没有使用LRU等策略，导致hashmap数据量越来越多，最终导致内存泄漏；
操作文件读写时，没有将close放入finally中，最终导致文件描述符越来越多，导致内存泄漏；

4、JMM

（1）JMM结构

主存储器：所有实例对象存储的位置，实例所拥有的字段也存储在里面，是所有线程共享的；
工作存储器：每个线程都有自己的工作存储器，工作存储器存储主存储器所必要的数据拷贝；
线程无法直接对主存储器进行操作，只能通过主存进行通信；

（2）操作类型

read：作用于主内存，将共享变量从主内存传送到工作内存中；
load：作用于工作内存，将read中的值读取到的值放入工作内存的变量副本中；
store：作用于工作内存，将工作内存中的变量副本传送到主内存中；
write：作用于主内存中，将strore的值写入到主内存的共享变量中；
use：作用域工作内存，会将工作内存的值传递给执行引擎，每当虚拟机需要使用该变量，就会执行该操作；
assign：作用于工作内存，每当虚拟机遇到一个赋值指令，就会把执行引擎中获取的值赋值给工作内存中的变量；
lock：作用于主内存，将变量标记为线程独占状态；
unlock：作用于主内存，释放独占状态；

（3）三大特性

原子性：JMM 保证了 read、load、assign、use、store 和 write 六个操作具有原子性，除了long、double，其余基本数据类型都是原子性的；
可见性：一个线程修改了变量，会同步给主内存，赶在其他线程修改之前刷新主内存。使用volatile修饰变量，变量更新会立即同步到主内存中，其他线程修改该变量之前，需要到主内存中拉取变量更新到自己的工作内存；
有序性：在线程中观察，可以发现操作是有序的，而在另外一个线程中观察，操作是无序的；java中有一些默认的happen-before：

- 程序次序：一个线程内，按照代码顺序，写在前面的操作先行发生于写在后面的操作。
- 监视器锁定：unLock 操作先行发生于后面对同一个锁的 lock 操作。
- volatile：对一个变量的写操作先行发生于后面对这个变量的读操作。
- 传递规则：如果操作 A 先行发生于操作 B，而操作 B 又先行发生于操作 C，则操作 A 先行发生于操作 C。
- 线程启动：对线程 start() 的操作先行发生于线程内的任何操作。
- 线程中断：对线程 interrupt() 的调用先行发生于线程代码中检测到中断事件的发生，可以通过 Thread.interrupted() 方法检测是否发生中断。
- 线程终结规则：线程中的所有操作先行发生于检测到线程终止，可以通过 Thread.join()、Thread.isAlive() 的返回值检测线程是否已经终止。
- 对象终结规则：一个对象的初始化完成先行发生于它的 finalize() 方法的开始。

（4）内存屏障

load-load barriers：指令前插入load Barriers，会使高速缓存直接失效，强制重新从主内存加载数据；如下:load1数据的加载会先于load2及后面的数据的加载

load1
LoadLoad
load2
load-store Barriers：load1数据的加载会先于store2及后面数据存储指令加载到主内存；

load1
LoadStore
store2
store-store Barriers：store1数据写入主内存，优先于store2及后面的数据写入主内存，使用store barriers，能让写入缓存的数据最快加载如主内存，让其他线程可见；

store1
StoreStore
store2
store-load Barriers：在load2及后续所有读取操作执行之前，保证store1写入对多有处理器都可见；开销最大，涵盖前三条；

store1
StoreLoad
load2

5、字节码看并发编程

（1）线程模型

对于java虚拟机中，每一个java线程会对应一个轻量级进程LWP；
轻量级线程是调用系统内核所提供的一套接口，实际上还需要调用内核线程KLT；
具体的概念，如创建，同步等，需要进行系统调用；
系统调用需要用户态和内核态进行切换，即上下文切换，开销较大；

（2）Synchronized字节码

方法加上Synchronized关键字，字节码是在flag标志处加上同步标志；

对对象使用synchronized，字节码是通过一套monitorenter，monitorexit来使用的

复制代码

public class SynchronizedDemo {
    synchronized void m1() {
        System.out.println("m1");
    }
    final Object lock = new Object();
    void doLock() {
        synchronized (lock) {
            System.out.println("lock");
        }
    }
}

（3）对象内存布局

Mark Word：用来存储 hashCode、GC 分代年龄、锁类型标记、偏向锁线程 ID、CAS 锁指向线程 LockRecord 的指针等，synconized 锁的机制与这里密切相关；
Class Point：用于执行对象所对应的类元数据信息，JVM通过他直到对象属于哪个Class；
Instance Data：真正存储对象数据，如字段内容等；
Padding：对象字节必须为8倍数，该字段会自动填充到8倍数；

6、