画图理解JVM相关内容

文章目录

      1. JVM视角下,内存划分
      1. 类内存分布硬核详解
        1. 获取堆内存参数
        1. 扫描堆内存,定位实例
        1. 查看实例所在地址的数据
        1. 找到实例所指向的类信息的地址
        1. 查看class信息
        1. 结论
      1. Java的对象创建流程
      1. 垃圾判别算法
      • 4.1 引用计数法
      • 4.2 可达性分析算法
      1. 垃圾收集算法
      • 5.1 标记-清除算法
      • 5.2 标记-复制算法
      • 5.3 标记-整理算法

1. JVM视角下,内存划分

tip: 额外补充

  • 在以"分代设计"为主导的堆内存,其控件划分大致如上图所示。但G1垃圾回收期为分解,后续的内存设计并没有都参考分代理论,因此jdk8以后(G1大规模运用在jdk8之后),内存划分有待商榷
  • 堆虽然是线程共享的,但他可以为线程划分缓冲区------Thread Local Allocation Buffer,TLAB。TLAB是线程私有的。但无论怎么划分,堆都是存储对象实例
  • 直接内存:属于操作系统本地内存,不归JVM管理。因此GC对他无效

2. 类内存分布硬核详解

既然是硬核,不来点内存轰炸是对不起硬核两字。

下文主要讲述一个类在创建过程中,可能会涉及到的所有类在内存的分布情况。包括JVM层面的instanceKlass,Java层面的Test实例,Test.class

下文内容比较硬核,请读者酌情阅读。另外,底层指针分析可能存在纰漏,欢迎读者友善指出

让我们开始!


demo代码如下

java 复制代码
package com.xhf.test;

// -XX:+UseSerialGC -Xmn10M -XX:-UseCompressedOops
public class TestDemo {
    public static void main(String[] args) {
        new Test();
        while (true) {}
    }
}
java 复制代码
package com.xhf.test;

public class Test {
    private static Integer a;
    private Integer b;
    private int c;
    public int d;

    private void func() {}
    public void func2() {}
}

1. 获取堆内存参数

打开HSDB,扫描堆的整体内存范围 universe

复制代码
Heap Parameters:
Gen 0:   eden [0x0000000080000000,0x00000000803845a8,0x0000000080800000) space capacity = 8388608, 43.96257400512695 used
  from [0x0000000080800000,0x0000000080800000,0x0000000080900000) space capacity = 1048576, 0.0 used
  to   [0x0000000080900000,0x0000000080900000,0x0000000080a00000) space capacity = 1048576, 0.0 usedInvocations: 0

Gen 1:   old  [0x0000000080a00000,0x0000000080a00000,0x000000008fe00000) space capacity = 255852544, 0.0 usedInvocations: 0

其它信息我们可以不用关注,只需要知道,eden区的范围是0x0000000080000000 0x0000000080800000,绝大多数情况下,对象的空间有限划分在eden区域。因此,我们想要探查Test示例相关内存地址,需要扫描eden区域

2. 扫描堆内存,定位实例

scanoops 0x0000000080000000 0x0000000080800000 com.xhf.test.Test

复制代码
hsdb> scanoops 0x0000000080000000 0x0000000080800000 com.xhf.test.Test
0x000000008023e2d0 com/xhf/test/Test

主程序运行new Test();,他的实例对象被划分在0x000000008023e2d0地址

3. 查看实例所在地址的数据

inspect 0x000000008023e2d0

复制代码
hsdb> inspect 0x000000008023e2d0
instance of Oop for com/xhf/test/Test @ 0x000000008023e2d0 @ 0x000000008023e2d0 (size = 32)
_mark: 1
_metadata._klass: InstanceKlass for com/xhf/test/Test
b: null null
c: 0
d: 0

在控制台上通过指令,查看不到最全面的信息,通过Tools->inspector创建可视化窗口,可以查看最全面的信息,具体如下

通过上述两幅图,我们可以返现很多有趣的细节

  1. _mark字段,mark其实就是markword,对象头的意思。markword能够存储相当丰富的信息,比如分代年龄,gc次数,偏向锁,重锁等等信息。
  2. _metadata._klass,类型指针,指向类型com.xhf.test.Test.class。该字段用于表示当前实例是哪个类的实例
  3. b, c, d:3个字段属于oop,但a不属于oop,a属于Test.class,因为他是静态变量。此外,b这个Object被赋值null,c,d两个基本int类型赋值为0

4. 找到实例所指向的类信息的地址

我们找到Test oop,但没有找到存储Test类信息的数据地址。inspect无法直接看到_metadata._klass指向的地址,我们通过内存扫描,直接查看内存数据

mem 0x000000008023e2d0 2 :查看0x000000008023e2d0地址,偏移2个单位(8bit)

复制代码
hsdb> mem 0x000000008023e2d0 2
0x000000008023e2d0: 0x0000000000000001 
0x000000008023e2d8: 0x0000000013ff3400 

0x0000000013ff3400 ,就是oop指向的Test类信息所在地址

注意,笔者这里并没有说明0x0000000013ff3400是Test.class类对象的地址

5. 查看class信息

如下图所示,0x0000000013ff3400才是class真正的信息,这也被称为元信息,被JVM存储在meta space中


!!!需要注意的是,0x0000000013ff3400地址上的内容不是Java意义上的Test.class这个类

笔者为什么会这么说呢?原因是JVM内部采用C++的instanceKlass描述

Java类,并且会将instanceKlass分配到meta space

而instanceKlass有个叫做_java_mirror的字段,它指向的才是Java类的Class对象

本例中就是Test.class这个对象

我们监视这个地址inspect 0x000000008023e210

复制代码
hsdb> inspect 0x000000008023e210
instance of Oop for java/lang/Class @ 0x000000008023e210 @ 0x000000008023e210 (size = 168)
a: null null

发现_java_mirror指向的对象,是java/lang/Class类(Test.class),并且大小168bit

我们扫描0x000000008023e210往后的168bit(21个8bit)内存空间

mem 0x000000008023e210 21

复制代码
hsdb> mem 0x000000008023e210 21
0x000000008023e210: 0x0000000000000001 
0x000000008023e218: 0x0000000013c03ed0 
0x000000008023e220: 0x0000000000000000 
0x000000008023e228: 0x0000000000000000 
0x000000008023e230: 0x0000000000000000 
0x000000008023e238: 0x00000000800dba38 
0x000000008023e240: 0x0000000000000000 
0x000000008023e248: 0x0000000000000000 
0x000000008023e250: 0x0000000000000000 
0x000000008023e258: 0x0000000000000000 
0x000000008023e260: 0x0000000000000000 
0x000000008023e268: 0x0000000000000000 
0x000000008023e270: 0x0000000000000000 
0x000000008023e278: 0x0000000080239560 
0x000000008023e280: 0x0000000000000000 
0x000000008023e288: 0x0000000000000000 
0x000000008023e290: 0x0000000013ff3400 
0x000000008023e298: 0x0000000000000000 
0x000000008023e2a0: 0x0000001500000000 
0x000000008023e2a8: 0x0000000000000001 
0x000000008023e2b0: 0x0000000000000000 

发现内存地址为0x000000008023e290时,存放的数据是:0x0000000013ff3400

0x0000000013ff3400的内容,恰好是instanceKlass所在地址。

6. 结论

基于上述分析,我们得出如下结论:

Test实例 -> Test instanceKlass <-> Test.class

文字枯燥乏味,看图就好理解了

3. Java的对象创建流程

有了第2节的基础,第三节的分析自然就简单多了。

具体流程直接上图

这个流程中,具体的内存情况如下

tip:

严格来说,上图存在一定的问题。

由第2节可知,实例的指针指向的是instanceKlass,而非class对象。这里这么处理是为了方便画图。

而且,instanceKlass拥有class对象的指针,实例可以通过instanceKlass找到class对象,只是需要两次指针跳跃,所以上图绘制方式其实也并无太大问题

4. 垃圾判别算法

4.1 引用计数法

给对象增加计数器,当计数器为0,表示对象不再被引用。可以当作垃圾被垃圾清除器清理

这种算法的缺陷很明显,一方面开销大,JVM需要维护所有对象的引用计数器;另一方面,无法解决循环引用的问题

4.2 可达性分析算法

以GC Root根节点的集合,作为起始点。按照对象之间的引用关系向下遍历,如果某个对象无法和GC Root关联,那么我们认为该对象是不可达的,可以当作垃圾被回收

5. 垃圾收集算法

在讲解回收算法前,我们需要补充一些分代理论的基础知识

  • 大部分对象都是朝生幕死,创建出来很快就被回收
  • 如果一个对象经历了多次垃圾回收,那么该对象可以被认为是长时间存活的对象

曾经有个组织做过调查,98%的对象活不过一轮垃圾回收

考虑到对象存活时间长短存在差异,我们可以大致将堆内存划分为两块空间

  • 新生代(Young Generation)
  • 老年代(Old Generation)

新生代存放寿命短的对象;老年代存放长命的对象。这样在做垃圾回收时,可以根据不同区域对象存活特点做出不一样的垃圾回收策略,以此提高运行效率

5.1 标记-清除算法

标记清楚算法是最基础的垃圾回收算法,后续的算法基本都是在此基础上进行改进。

该算法的核心是

  • 标记垃圾(可达性分析算法)
  • 清除垃圾

标记-清除算法执行流程如上图所示

上述算法存在以下两个缺陷

  • 算法效率不稳定:如果内存中存在大量需要清除的垃圾,JVM需要执行多次的清除操作;反之,如果垃圾数量较少,JVM执行清除操作次数就少
  • 空间碎片:当JVM执行清除操作后,会存在大量内存碎片,内存中使用的空间不连续。这极大的降低了内存利用率,提高了内存申请的难度

5.2 标记-复制算法

标记-复制算法,将内存划分为等大的两个空间,一个空间用于存放对象,另一个空间用于预留。

当需要进行内存清除时,操作异常容易,因为两个区间在同一时刻只有一个区间存在使用的对象,因此只需要将存放对象的空间中,存活的对象复制到预留空间,然后清除原有空间的所有内容,即可完成垃圾回收

该算法让JVM只需要关注存活的对象,如果存活对象少 ,那么复制操作少,效率高,因此标记-复制 算法一般用于Eden区域 的垃圾回收。此外,该算法成功解决了内存碎片的问题

但显而易见,该算法带来了另一个问题

  • 内存利用率低:该算法需要额外的空间进行存储,比标记清除算法大了1倍的空间

5.3 标记-整理算法

该算法就是在标记-清除的基础上,增加了整理的操作。对于清除后的内存空间,该算法会通过移动已使用的空间,让内存的使用再次连续

该算法解决了内存碎片问题,但移动存活对象这个操作引入了新的问题。就比如原先对象A引用了对象B,现在B的地址修改了,A如何感知到。此外,在移动过程中,需要暂停用户线程(Stop the world),因此需要移动的对象数量要尽可能少,以此减少stop the world的时间

相关推荐
典则32 分钟前
STM32FreeRtos入门(五)——同步互斥与通信
java·jvm·stm32
稚辉君.MCA_P8_Java1 小时前
Bash 括号:()、{}、[]、$()、$(() )、${}、[[]] 到底有什么区别?
开发语言·jvm·后端·容器·bash
软件2054 小时前
【JDK、JRE、JVM】
java·开发语言·jvm
学习编程的Kitty5 小时前
JavaEE初阶——多线程(3)线程安全
java·开发语言·jvm
华仔啊1 天前
JVM参数到底配在哪?7大场景全解,新手不再迷茫!
java·jvm
流星5211222 天前
GC 如何判断对象该回收?从可达性分析到回收时机的关键逻辑
java·jvm·笔记·学习·算法
JanelSirry2 天前
我的应用 Full GC 频繁,怎么优化?
jvm
JH30732 天前
jvm,tomcat,spring的bean容器,三者的关系
jvm·spring·tomcat
DKPT2 天前
JVM直接内存和堆内存比例如何设置?
java·jvm·笔记·学习·spring
siriuuus2 天前
JVM 垃圾收集器相关知识总结
java·jvm