JVM系列-5.java内存区域

  • 👏作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家
  • 📕系列专栏:Spring原理、JUC原理、Kafka原理、分布式技术原理、数据库技术、JVM原理
  • 🔥如果感觉博主的文章还不错的话,请👍三连支持👍一下博主哦
  • 🍂博主正在努力完成2023计划中:源码溯源,一探究竟
  • 📝联系方式:nhs19990716,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬👀

Java内存区域

Java虚拟机在运行Java程序过程中管理的内存区域,称之为运行时数据区

《Java虚拟机规范》中规定了每一部分的作用。

运行时数据区 -- 应用场景

通过上面的问题,可以知道java内存模型实际上是非常重要的,那么如何去学习它呢?

程序计数器

程序计数器(Program Counter Register )也叫PC寄存器,每个线程会通过程序计数器记录当前要执行的的字节码指令的地址。

一个程序计数器的具体案例:

在加载阶段,虚拟机将字节码文件中的指令读取到内存之后,会将原文件中的偏移量转换成内存地址。每一条字节码指令都会拥有一个内存地址。

在代码执行过程中,程序计数器会记录下一行字节码指令的地址。执行完当前指令之后,虚拟机的执行引擎根据程序计数器执行下一行指令。

程序计数器可以控制程序指令的进行,实现分支、跳转、异常等逻辑。

在多线程执行情况下,Java虚拟机需要通过程序计数器记录CPU切换前解释执行到那一句指令并继续解释运行。

但是随之而来的有一个问题需要思考:

程序计数器在运行中会出现内存溢出吗?

内存溢出指的是程序在使用某一块内存区域时,存放的数据需要占用的内存 大小超过了虚拟机能提供的内存上限。

因为每个线程只存储一个固定长度的内存地址,程序计数器是不会发生内存 溢出的。

程序员无需对程序计数器做任何处理。

JAVA虚拟机栈

Java 虚拟机栈(Java Virtual Machine Stack )采用栈的数据结构来管理方法调用中的基本数据,先进后出(First In Last Out ),每一个方法的调用使用一个栈帧(Stack Frame)来保存。

通过Idea的debug工具查看栈帧的内容

Java虚拟机栈随着线程的创建而创建,而回收则会在线程的销毁时进行。由于方法可能会在不同线程中执行,每个线程都会包含一个自己的虚拟机栈。

Java虚拟机栈 - 栈帧的组成

局部变量表

局部变量表的作用是在方法执行过程中存放所有的局部变量。编译成字节码文件时就可以确定局部变量表的内容。

栈帧中的局部变量表是一个数组,数组中每一个位置称之为槽(slot) ,long和double类型占用两个槽,其他类型占用一个槽。

实例方法中的序号为0的位置存放的是this,指的是当前调用方法的对象,运行时会在内存中存放实例对象的地址。

方法参数也会保存在局部变量表中,其顺序与方法中参数定义的顺序一致。

局部变量表保存的内容有:实例方法的this对象,方法的参数,方法体中声明的局部变量。

然后来看一道思考题,以下代码的局部变量表中会占用几个槽?为什么?

为了节省空间,局部变量表中的槽是可以复用的,一旦某个局部变量不再生效,当前槽就可以再次被使用。

操作数栈

操作数栈是栈帧中虚拟机在执行指令过程中用来存放中间数据的一块区域。他是一种栈式的数据结构,如果一条指令将一个值压入操作数栈,则后面的指令可以弹出并使用该值。

编译期就可以确定操作数栈的最大深度,从而在执行时正确的分配内存大小。

帧数据

当前类的字节码指令引用了其他类的属性或者方法时,需要将符号引用(编号)转换成对应的运行时常量池中的内存地址。动态链接就保存了编号到运行时常量池的内存地址的映射关系。

方法出口指的是方法在正确或者异常结束时,当前栈帧会被弹出,同时程序计数器应该指向上一个栈帧中的下一条指令的地址。所以在当前栈帧中,需要存储此方法出口的地址。

异常表存放的是代码中异常的处理信息,包含了异常捕获的生效范围以及异常发生后跳转到的字节码指令位置。

栈内存溢出

java虚拟机栈是否会存在栈内存溢出呢?

Java虚拟机栈如果栈帧过多,占用内存超过栈内存可以分配的最大大小就会出现内存溢出

Java虚拟机栈内存溢出时会出现StackOverflowError的错误

如果我们不指定栈的大小,JVM 将创建一个具有默认大小的栈。大小取决于操作系统和计算机的体系结构。

如果要来模拟一个栈内存溢出呢?

使用递归让方法调用自身,但是不设置退出条件。定义调用次数的变量,每一次调用让变量加1。查看错误发生时总调用的次数。

当然我们可以动态的设置虚拟机栈的大小

要修改Java虚拟机栈的大小,可以使用虚拟机参数 -Xss 。

语法:-Xss栈大小

单位:字节(默认,必须是 1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)

注意事项

1、与-Xss类似,也可以使用 -XX:ThreadStackSize 调整标志来配置堆栈大小。 格式为: -XX:ThreadStackSize=1024

2、HotSpot JVM对栈大小的最大值和最小值有要求: 比如测试如下两个参数: -Xss1k -Xss1025m Windows(64位)下的JDK8测试最小值为180k,最大值为1024m。

3、局部变量过多、操作数栈深度过大也会影响栈内存的大小。

一般情况下,工作中即便使用了递归进行操作,栈的深度最多也只能到几百,不会出现栈的溢出。所以此参数可以手动指定为-Xss256k节省内存。

本地方法栈

Java虚拟机栈存储了Java方法调用时的栈帧,而本地方法栈存储的是native本地方法的栈帧。

在Hotspot虚拟机中,Java虚拟机栈和本地方法栈实现上使用了同一个栈空间。本地方法栈会在栈内存上生成一个栈帧,临时保存方法的参数同时方便出现异常时也把本地方法的栈信息打印出来。

一般Java程序中堆内存是空间最大的一块内存区域。创建出来的对象都存在于堆上。

栈上的局部变量表中,可以存放堆上对象的引用。静态变量也可以存放堆对象的引用,通过静态变量就可以实现对象在线程之间共享

需求:

通过new关键字不停创建对象,放入集合中,模拟堆内存的溢出,观察堆溢出之后的异常信息。

现象:

堆内存大小是有上限的,当对象一直向堆中放入对象达到上限之后,就会抛出OutOfMemory错误。

堆空间有三个需要关注的值,used total max。

used指的是当前已使用的堆内存,total是java虚拟机已经分配的可用堆内存,max是java虚拟机可以分配的最大堆内存。

arthas中堆内存相关的功能

堆内存used total max三个值可以通过dashboard命令看到。

手动指定刷新频率(不指定默认5秒一次):dashboard --i 刷新频率(毫秒)

按住ctrl + c 退出程序刷新

随着堆中的对象增多,当total可以使用的内存即将不足时,java虚拟机会继续分配内存给堆。

如果堆内存不足,java虚拟机就会不断的分配内存,total值会变大。total最多只能与max相等。

但是存在一个问题,就是是不是当used = max = total的时候,堆内存就溢出了呢?

其实并不是,因为堆内存溢出的判断条件比较复杂,里面涉及到了垃圾回收机制。

如果不设置任何的虚拟机参数,max默认是系统内存的1/4,total默认是系统内存的1/64。在实际应用中一般都需要设置total和max的值。

设置大小

  • 要修改堆的大小,可以使用虚拟机参数 --Xmx(max最大值)和-Xms (初始的total)。
  • 语法:-Xmx值 -Xms值
  • 单位:字节(默认,必须是 1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)
  • 限制:Xmx必须大于 2 MB,Xms必须大于1MB

比如:

-Xms6291456

-Xms6144k

-Xms6m

-Xmx83886080

-Xmx81920k

-Xmx80m

还存在一个问题,就是为什么arthas中显示的heap堆大小与设置的值不一样呢?

arthas中的heap堆内存使用了JMX技术 中内存获取方式,这种方式与垃圾回 收器有关,计算的是可以分配对象的内存,而不是整个内存。

Java服务端程序开发时,建议将-Xmx和-Xms设置为相同的值,这样在程序启动之后可使用的总内存就是最大内存,而无需向java虚拟机再次申请,减少了申请并分配内存时间上的开销同时也不会出现内存过剩之后堆收缩的情况

-Xmx具体设置的值与实际的应用程序运行环境有关

方法区

方法区是存放基础信息的位置,线程共享,主要包含三部分内容:

方法区是用来存储每个类的基本信息(元信息),一般称之为InstanceKlass对象。在类的加载阶段完成。

方法区除了存储类的元信息之外,还存放了运行时常量池。常量池中存放的是字节码中的常量池内容。

字节码文件中通过编号查表的方式找到常量,这种常量池称为静态常量池 。当常量池加载到内存中之后,可以通过内存地址快速的定位到常量池中的内容,这种常量池称为运行时常量池

方法区是《Java虚拟机规范》中设计的虚拟概念,每款Java虚拟机在实现上都各不相同。Hotspot设计如下:

JDK7及之前的版本 将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数来控制。

JDK8及之后的版本 将方法区存放在元空间中,元空间位于操作系统维护的直接内存中,默认情况下只要不超过操作系统承受的上限,可以一直分配。

arthas中查看方法区

使用memory打印出内存情况,JDK7及之前的版本查看ps_perm_gen属性。

JDK8及之后的版本查看metaspace属性。

-1代表不设上限,前提是不超过操作系统的上限。

实验-模拟方法区的溢出

通过ByteBuddy框架,动态生成字节码数据,加载到内存中。通过死循环不停地加载到方法区,观察方法区是否会出现内存溢出的情况。分别在JDK7和JDK8上运行上述代码。

ByteBuddy框架的基本使用方法

核心代码为:

实验发现,JDK7上运行大概十几万次,就出现了错误。在JDK8上运行百万次,程序都没有出现任何错误,但是内存会直线升高,这样有可能影响其他功能的正常使用。这说明JDK7和JDK8在方法区的存放上,采用了不同的设计。

JDK7将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数-XX:MaxPermSize=值来控制。

JDK8将方法区存放在元空间中,元空间位于操作系统维护的直接内存中,默认情况下只要不超过操作系统承受的上限,可以一直分配。可以使用**-XX:MaxMetaspaceSize=值**将元空间最大大小进行限制。

字符串常量池

方法区中除了类的元信息、运行时常量池之外,还有一块区域叫字符串常量池(StringTable)。

字符串常量池存储在代码中定义的常量字符串内容。比如"123" 这个123就会被放入字符串常量池。

字符串常量池和运行时常量池有什么关系?

早期设计时,字符串常量池是属于运行时常量池的一部分,他们存储的位置也是一致的。后续做出了调整,将字符串常量池和运行时常量池做了拆分。

StringTable练习题

需求:

通过字节码指令分析如下代码的运行结果?

最终是不想相等的,因为c是指向了字符串常量池中的"12",而d是指向了堆内存中的"12"。之所以是这样是因为变量连接是使用StringBuilder的。

再看另一个案例。

其是常量,编译阶段直接连接,所以返回true。

直接内存

直接内存(Direct Memory)并不在《Java虚拟机规范》中存在,所以并不属于Java运行时的内存区域。 在 JDK 1.4 中引入了 NIO 机制,使用了直接内存,主要为了解决以下两个问题:

1、Java堆中的对象如果不再使用要回收,回收时会影响对象的创建和使用。

2、IO操作比如读文件,需要先把文件读入直接内存(缓冲区)再把数据复制到Java堆中。

现在直接放入直接内存即可,同时Java堆上维护直接内存的引用,减少了数据复制的开销。写文件也是类似的思路。

要创建直接内存上的数据,可以使用ByteBuffer。

语法: ByteBuffer directBuffer = ByteBuffer.allocateDirect(size);

注意事项: arthas的memory命令可以查看直接内存大小,属性名direct。

如果需要手动调整直接内存的大小,可以使用-XX:MaxDirectMemorySize=大小

单位k或K表示千字节,m或M表示兆字节,g或G表示千兆字节。默认不设置该参数情况下,JVM 自动选择 最大分配的大小。

以下示例以不同的单位说明如何将 直接内存大小设置为 1024 KB:

-XX:MaxDirectMemorySize=1m

-XX:MaxDirectMemorySize=1024k

-XX:MaxDirectMemorySize=1048576

相关推荐
sunbin11 分钟前
稀土掘金我要吐槽你
后端
程序员鱼皮2 小时前
我代表编程导航,向大家道歉!
前端·后端·程序员
zjjuejin2 小时前
Maven 生命周期与插件机制
后端·maven
阿杆2 小时前
为什么我建议你把自建 Redis 迁移到云上进行托管
redis·后端
Java水解2 小时前
go语言教程(全网最全,持续更新补全)
后端·go
bobz9653 小时前
QEMU 使用 DPDK 时候在 libvirt xml 中设置 sock 的目的
后端
thinktik3 小时前
AWS EKS 计算资源自动扩缩之按需申请Fargate[AWS 中国宁夏区]
后端·aws
thinktik3 小时前
AWS EKS 实现底层EC2计算资源的自动扩缩[AWS 中国宁夏区]
后端·aws
uhakadotcom3 小时前
什么是OpenTelemetry?
后端·面试·github
知其然亦知其所以然3 小时前
MySQL 社招必考题:如何优化特定类型的查询语句?
后端·mysql·面试