JVM的原理

什么是JVM

jdk是java开发工具包,jre是java运行时环境, jvm是java虚拟机,我们可以认为jvm是jre的一个部分,jre是jdk的一个部分,jvm是解释java字节码,按照经典的划分方法,java属于半编译半解释的方式。java这么设定是为了跨平台。java不喜欢重新编译,而是希望直接执行。

jvm通过javac把.java文件编译成.class文件(字节码文件),**字节码文件就是java自己搞的一套cpu指令。**然后在某个平台上面执行,然后通过jvm转成cpu能够识别的机器指令。实际上jvm就是一个翻译官。因此只要jvm拿到.class文件,就知道如何转化了。

实际上不同系统的jvm是不一样的,但是对上的java是一样的。

.HotSpot VM是我们装的jvm。

1.JVM中的内存区域划分:

其实JVM也是一个进程(任务中看到的java程序),如下图

当我们进程运行,要从操作系统中申请资源(实际上内存就是其中一个重要的资源),这些资源就支撑了后续java程序的运行,定义变量实际上就是申请内存,内存实际上就是jvm从操作系统这边申请到的。

JVM从系统上面申请了一大块内存空间,然后这一大块内存给java程序,又会根据很多不同的使用用途来划分出不同的空间,这也就是所谓的内存区域划分。

JVM也会划分出不同的区域,每个区域都有不同的作用。

  1. **堆(只有一份):**代码中new出来的对象都在堆里面,对象中的非静态成员变量。
  2. **栈:**栈包括本地方法栈和虚拟机栈:包含了调用关系和局部变量。虚拟机栈记录了java代码的调用关系。本地方法:本地方法的调用(内部通过 c++代码写的调用关系)。一般说的栈都是讲的是虚拟机栈。
  3. **程序计数器:**比较小的空间,专门用来存储下一条执行的java指令地址,表示下一条要执行的java指令在哪里。
  4. **元数据(方法)区(只有一份):**一些辅助性的数据,类的信息和方法的信息,一个程序有哪些类,每个类中有哪些方法,每个方法中要执行的哪些指令(if,else),都会记录在元数据区,javac转化成字节码文件,字节码文件在程序运行的时候就会被JVM加载到方法区。(字节码文件要加载后才能执行)。

每个线程有自己的栈和程序计数器。

static修饰的变量称为类属性,static修饰的为类方法(带有static元数据区),非static修饰变量为实例属性,非static修饰的方法为实例方法。区分变量在哪个位置(局部,全局,静态成员)。


2.JVM的类加载机制(多记)

类加载 指的是.java文件要想运行,需要把.class文件从硬盘中读到内存 ,并进行一系列解析工作。

  1. 加载 :把硬盘上的.class文件**找到(有说法的)**读取文件信息。
  2. 检验 :需要确保读到的.class文件是合法的格式,magic用于标识当前的二进制文件格式是什么类型。是图片还是文字。major version是主版本,minior是次版本,一般高版本的jvm'可以运行0低版本的jvm。
  3. 准备:给类对象申请空间,此时申请的内存空间默认都是全0的(这个阶段类对象的静态成员变量也是0)。
  4. 解析 :主要是针对类中的字符串常量进行处理。将符号引用替换成常量引用。上面代码中相当于保存了字符串常量的地址,但是文件不存在地址,内存中才有地址,所以存储了hello的相对偏移量(符号引用)。从s到hello的距离。当从文件加载到内存中,此时s就有地址了。
  5. 初始化:针对类对象进行初始化,就是对后续进行赋值填充。执行静态代码块的逻辑,还可能出发父类加载。

双亲委派模型重要(在加载环节涉及到的,如何找到.class文件)

JVM中进行类加载是有一个模块叫做类加载器,有三个。

  1. BootStrapClassLoader,
  2. ExtensionClassLoader
  3. ApplicationClassLoader

给一个全限定类名比如java.lang.String这种的通过类加载器去寻找对应的.class文件,,三个分别从不同的目录Booksrap负责寻找标准库,Extension分别找扩展库,Application这个负责查找当前项目中的代码目录以及第三方的库。

这三个类加载器存在父子关系,有指针进行指向。

双亲委派模型实际上就是描述上述类加载器是如何工作的。

双亲委派模型工作原理 :

  • 从Application作为入口,先开始工作。
  • Application不会立即搜索自己的目录,会将搜索的任务交给自己的父亲。
  • Extension也不会立即搜索也会交给自己的父亲也要交给上层。
  • bootstrap也不想搜索,也要交给自己的父亲。
  • 发现没有父亲,只能自己干活。只能搜索标准库,通过全限定类名去寻找符合要求的,class文件.
  • 如果找到了就直接进入打开文件的操作,直接进行打开,否则就进行孩子这边
  • 没找到的话,Extension就去扩展库中寻找
  • 没找到就继续给Application。
  • 如果找不到类加载就失败了,此时就会抛出ClassNotFoundException异常

上述这样的设定是为了确保类加载器的优先级,假设我们自己定义的java.lang.String就不会被加载,因为有标准库中的java.lang.String会先被找到,以上的设置是为了防止自己写的类和标准库中的类名字重复导致标准库中的失效 。

可以打破双亲委派模型。

3.JVM中的垃圾回收机制(GC)

让释放内存的操作交给JVM完成,程序自动判断某个内存是否会继续使用,如果不使用就会被自动释放掉。

STW问题:触发垃圾回收,很可能会其他业务停止。在java中垃圾回收技术已经逐渐成熟 ,把stw控制在1ms中

JVM中的内存有好几块:

  1. 程序计数器:不需要GC。
  2. 栈:(不需要GC),局部变量在程序结束后自动销毁(生命周期很明确)。
  3. 方法区:不需要GC,放的是类对象,一般都是类加载,不会去类卸载。
  4. 堆:GC的主要战场!!!:回收对象,java中的回收是以类为单位的。对象正在使用的不能释放,不在使用 。有的内存处于一半使用一半不使用也不释放。(以对象为单位)。

垃圾回收具体如何进行

识别垃圾

判断垃圾后续是否继续使用,在java中要通过引用的方式使用,(除了匿名对象),一个对象没有任何引用指向,就视为无法被代码使用,就被当做垃圾了。

t在执行完后就被释放了,然后new Test()也没有人指向了,所以new Test()就被回收了。如果有更多的对象指向,就要等到所有的指向都结束才能回收垃圾。

所以由于更多指向代码更加复杂我们引用了两种方式来解决垃圾回收

1引用计数(java没有使用)

给每个对象额外安排一个空间,空间里面保存有几个引用,就在堆旁边,有两个指向,如果a变成null的话,堆旁边的数字就会-1,此时当两个都没有指向,垃圾回收机制:有扫描线程扫描是否为0,如果是0的话就进行垃圾回收。

问题1.内存消耗很多

他会小号额外的内存空间(要给每个都安排计数器,如果计数器每个安排两个字节),假设每个对象的体积比较小,但是每个计数器都要2字节,就会消耗很多。

问题2.循环引用的问题(导致计数器无法继续工作)

两个对象四个引用,但是把ab全部置0, 但是new Test()中还有引用,就new Test()中有一个Test存储其他地址。不能被GC垃圾回收。

2.可达性分析(时间换空间)

本质上时间换空间。

比如栈上的局部变量/方法区中的静态类型变量/常量池的对象,就可以从这些变量为起点,尝试去遍历,遍历一圈后,所有能够被访问到的就不是垃圾。否则就是垃圾。(消耗时间)。

构造出一颗二叉树,当我们返回root的时候,虽然只有root一个引用,但是实际上其他节点都是可达的。JVM中存在扫描线程,会不停进行遍历,尽可能多的遍历到更多节点,确保每个对象都可达,确保能够遍历的不会被释放掉。

如果其他 节点设为null,通过可达性分析的遍历,可达分析到剩下的全部清除。

把标记为垃圾的内存进行释放

主要的释放方式有三种

1.标记为垃圾的直接清除(最朴素的做法,一般不用)

上述释放方式会产生很多小的离散的碎片空间,可能会导致后面申请内存空间失败,因为申请内存都是申请一整块连续的内存空间。导致碎片化没有连续的想申请的内存空间大小。

2.复制算法

只使用一半,核心就是不直接释放内存,把不是垃圾的13复制到内存的另外一边,把左边全部都释放。

缺点:可用的总内存变小了。如果复制对象比较多,那么系统开销也会比较大,适合大部分删除,少部分留下的情况。

3.标记整理(搬运)

当我们碰到碎片的时候,就把后面的必要内容进行搬运到前面来原本是12345678.

类似于顺序表搬运。开销很大。

JVM没有使用上面的三种方案,而是使用综合性方案,取长补短。JVM使用分代回收(根据不同类型进行采取不同的方式)。

分代回收:

JVM有专门线程进行周期扫描,一个对象如果被扫描一次,可达了(不是垃圾),年龄就+1(初始为0),JVM中就会根据对象年龄的差异,就会把内存分为两个不同的部分。

  1. 新生代
  2. 老生代
  1. 当代码new创建一个新的对象,就放在伊甸区,(大概率活不过第一轮GC,生命周期很短)。
  2. 少数通过第一轮GC的时候,通过复制算法,就进入到了生存区。后续GC还要扫描不仅扫描伊甸区还要扫描生存区对象,生存区的大部分对象也会被扫描中被标记为垃圾,少数存活的就会被拷贝到另一个生存区。(只要这个对象能够继续存活,就会被复制算法拷贝到另外一个生存区(反复拷贝,不仅来自伊甸区还有另一个生存区))。
  3. 如果经历若干轮GC都没有死亡,JVM就认为这个对象的生命周期很长 ,就会拷贝到老年代。
  4. 老年代扫描的频率就会小很多(要G早G了)。
  5. 如果对象在老年代死亡,JVM就会按照标记整理的操作(新生代复制,老年代整理)。

实际上上述和我们找工作是一样的。

java的路很长,道阻且长,且行且珍惜。

相关推荐
xiao--xin14 分钟前
Java定时任务实现方案(一)——Timer
java·面试题·八股·定时任务·timer
MrZhangBaby27 分钟前
SQL-leetcode—1158. 市场分析 I
java·sql·leetcode
一只淡水鱼6641 分钟前
【spring原理】Bean的作用域与生命周期
java·spring boot·spring原理
五味香1 小时前
Java学习,查找List最大最小值
android·java·开发语言·python·学习·golang·kotlin
jerry-891 小时前
Centos类型服务器等保测评整/etc/pam.d/system-auth
java·前端·github
Jerry Lau1 小时前
大模型-本地化部署调用--基于ollama+openWebUI+springBoot
java·spring boot·后端·llama
小白的一叶扁舟1 小时前
Kafka 入门与应用实战:吞吐量优化与与 RabbitMQ、RocketMQ 的对比
java·spring boot·kafka·rabbitmq·rocketmq
幼儿园老大*1 小时前
【系统架构】如何设计一个秒杀系统?
java·经验分享·后端·微服务·系统架构
言之。1 小时前
【Java】面试中遇到的两个排序
java·面试·排序算法
计算机-秋大田2 小时前
基于SSM的家庭记账本小程序设计与实现(LW+源码+讲解)
java·前端·后端·微信小程序·小程序·课程设计