JVM——引言+JVM内存结构

引言

什么是JVM

定义:

Java VirtualMachine -java 程序的运行环境 (ava 二进制字节码的运行环境)

好处:

  • 一次编写,到处运行
  • 自动内存管理,垃圾回收功能
  • 数组下标越界检查,
  • 多态

比较:

jvm jre jdk

学习jvm的作用

  • 面试
  • 理解底层实现原理
  • 中高级程序员的必备技能

常见的jvm

自己百度查找

jvm的组成

内存结构

程序计数器

定义

Program Counter Register 程序计数器(寄存器)

作用

如下图所示

右边就是简单的java代码打印操作,编译成左侧的二进制字节码。

经过解释器------>机器码------>CPU执行。

程序计数器在这里面的作用就是记住下一条jvm指令的执行地址。

第一条指令地址是0,第一条指令交给解释器去执行的同时会把第二条指令的地址3放入程序计数器。第一条执行完之后,解释器会去取出3来执行......

物理实现: 通过CPU中寄存器(速度快)实现

特点:

线程私有

每个线程都有自己的程序计数器。

每一个线程会有被分配一个时间片,在当前时间片内不能执行完会去执行别的线程的代码,直到轮到下一个时间片。

切换到别的线程时要记住当前执行到哪里,还是要用到程序计数器。通过私有的程序计数器知道下一行代码的地址。

唯一不会存在内存溢出的区

虚拟机栈

栈是一种普通的先进后出的数据结构。

java的虚拟机栈则是线程运行需要的内存空间

一段代码有多个方法组成,一个栈帧表示一次方法的调用,栈帧就是每个方法运行需要的内存。

运行:调用第一个方法时会给第一个方法划分一个栈帧空间,并压入栈内,执行完后会出栈,也会释放该方法占用的内存。

然后方法1调用方法2时会产生一个方法2的栈帧并入栈,然后方法2调用方法3也会产生并入栈,如下图所示。

定义

Java Virtual Machine Stacks (Java 虚拟机栈)

  • 每个线程运行时所需要的内存,称为虚拟机栈
  • 每个栈由多个栈帧 (Frame) 组成,对应着每次方法调用时所占用的内存
  • 每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法

栈帧大小由方法里的参数以及局部变量的个数决定

问题辨析

1.垃圾回收是否涉及栈内存?

栈内存是一次次方法调用产生的栈帧内存,调用结束后会弹出栈,会自动回收,不需要垃圾回收 管理,垃圾回收是回收堆内存中的无用对象。

2.栈内存分配越大越好吗?

运行java代码时是可以指定栈内存大小的,使用-Xss size,下图还有不同系统下默认栈内存的大小和设定内存的示例。

栈内存越大会让线程数变少,512mb的物理内存下,每个线程的栈内存设置1mb大小可以运行512个,设置2mb大小可以运行256个线程。不会提高线程效率,但可以增加递归的层数。

3.方法内的局部变量是否线程安全?

根据该变量是每个线程共享还是线程私有判断。下图是一个方法,方法内有一个局部变量。

该方法被调用两次时会有两个不同的栈。每个线程都会有私有的局部变量。因此这里不会有线程干扰的问题。

假如将x改为static int x=0;的话就会出现线程干扰,如果不加保护的话会有线程安全问题。

总结:共享需要考虑线程安全,私有就不需要考虑。

  • 如果方法内的局部变量没有逃离方法的作用范围,则是线程安全。
  • 如果是局部变量引用了对象,并逃离方法的作用方法,需要考虑线程安全(引用传递和值传递的问题)

栈内存溢出

  • 栈帧过多导致栈内存溢出(栈帧过多爆栈) : 通常在的递归导致。
  • 单片栈帧过大导致栈内存溢出(太大了,已经塞满了)

一般不会有单片过大,栈帧里都是方法参数和局部变量。可以通过设置栈内存大小达到

在将对象转换成json对象时也会有栈溢出,这种两个类的循环问题会导致json解释器出现问题。

可以通过一个@JsonIgnore注解达到在json转换对象时忽略变量的效果。

线程运行诊断

案例1: cpu 占用过多

linux环境下运行一段java代码导致cpu占用过高,可以使用top命令定位到哪一个进程占用,但看不见是哪一个线程导致的。

在linux下使用ps H -eo pid,tid,%cpu命令可以看见所有线程的pid(进程号),tid(线程号),%cpu(cpu占用)。

使用ps H -eo pid,tid,%cpu | grep 32655 后面加上| grep pid过滤无关进程的线程。

  • 用top定位哪个进程对cpu的占用过高
  • ps H -eo pid,tid,%cpu | grep pid (用ps命令进一步定位是哪个线程引起的cpu占用过高)
  • jstack 进程id (可以根据线程id 找到有问题的线程,进一步定位到问题代码的源码行号)

生产环境不推荐jstack,因为打印线程信息jvm会暂停其他线程

然后将线程编号32665转换成16进制(7F99)在输出内容中查找

在jstack 输出内容中可以看见一个nid=Ox7f99的线程,状态为RUNNABLE.

看见问题出在第8行代码。如下图源码第8行是个死循环。

nid、pid 和 tid 是计算机系统中常用的三个标识

  • nid (Node ID) 是指在分布式系统中,每个节点的唯一标识
  • pid (Process ID) 是指操作系统中每个进程的唯一标识。
  • tid (Thread ID) 是指操作系统中每个线程的唯一标识。

案例2: 程序运行很长时间没有结果

线程死锁导致的无结果下使用jstack命令查看,下输出内容最后可以看见有关死锁信息。

两个线程都想获得a,b,但是都在等对方放开拥有的对象,然后陷入死锁。

产生死锁的四个必要条件:互斥、不可剥夺、请求和保持、循环等待。

本地方法栈

定义: java虚拟机在调用本地方法时需要给本地方法提供的内存空间

在Object这个类中就有很多,比如Object的clone方法的声明是native,这个native的实现是c/c++,java代码是间接调用native

定义

通过 new 关键字,创建对象都会使用堆内存

特点:

  • 它是线程共享的,堆中对象都需要考虑线程安全的问题
  • 有垃圾回收机制 (不再被引用的对象会被回收)

堆内存溢出

下图所示方法中String类型的对象a会一次次变大,直至堆溢出。

运行结果: 溢出内存错误: java 堆 空间

使用**-Xmx size**改变堆空间大小。

修改前26次才溢出,修改后17次溢出。

有可能堆内存较大,运行时间短,在系统前期看不出问题,后期才会爆掉,故测试时可以将堆内存设置较小进行排查。

堆内存诊断

相关工具:

1.jps 工具

查看当前系统中有哪些 java 进程

  1. jmap 工具

查看堆内存占用情况 jmap -heap 进程id(只能看某一瞬间的情况)

3.jconsole 工具

图形界面的,多功能的监测工具,可以连续监测

4.jvisualVM 工具

图形化界面,可以抓取当前快照

案例1

new一个10MB的数组对象,后面置为null,然后gc显式回收。

运行后通过jps查看进程id,jmap -heap 18756在1~2,2~3,3之后三个时间点抓取快照信息。

最大堆内存占用MaxHeapSize是4个G

Eden Space就是专门为new 出来的对象准备的。

1~2之间

数组创建之前使用了6Mb

2~3之间

创建数组对象之后使用16mb,

3之后

垃圾回收之后变成1.2mb

使用jconsole工具的界面。

案例2

垃圾回收之后,内存占用任然很高。

新生代被回收了,老年代没有被回收。

新生代剩8mb

老年代剩200mb

使用新的工具jvisualvm可视化虚拟机

保存快照之后进行查找最大的类

查看最大的ArrayList实例的具体信息

源代码

两百个Student对象,每个都开了一个1mb大小的byte数组。并且一直在作用范围内,无法回收,内存占用居高不下。

通过可视化界面的堆 dump按钮进行排查。

方法区

定义

按照jdk_jvm_1.8中的定义

  • 方法区是所有java虚拟区线程共享的区域。
  • 存储了和类的结构相关的信息。
  • 有成员变量filed,method data方法数据,成员方法、构造器方法的代码以及运行时常量值run-time constant pool等等
  • 在虚拟机启动时被创建
  • 逻辑上是堆的组成部分(1.8以前用的堆内存,1.8以后用的是系统内存
  • 方法区也会导致内存溢出

组成

永久代和元空间都是方法区这个概念的实现。

永久代和元空间最本质的区别就是 前者使用的是jvm内存 后者使用的是操作系统内存。

图中常量池是运行时常量池。

方法区内存溢出

  • 1.8 以前会导致永久代内存溢出
  • 1.8 之后会导致元空间内存溢出

下图代码就是一个加载了10000个类的代码,最外层继承实现了类加载器,在循环内指定版本号,类名,包名,父类,接口等信息创建一个新类。

这里元空间和永久代都没有设置上限,这里需要设置元空间和永久代大小。

-XX:MaxMetaspaceSize=8m 元空间

-XX:MaxPermSize=8m 永久代

元空间运行报异常

永久代报异常

场景:

  • spring
  • mybatis

spring和mybatis都使用到了cglib技术。

运行时常量池

下面的这段代码的二进制字节码含有如下信息。

使用如下命令查看该代码反编译后的结果

javap -v HelloWorld.class

常量池部分

虚拟机指令部分

执行指令时下面第一条就是获取静态变量,#2在常量池里面找。

ldc是找到一个引用地址。

定义:

  • 常量池,就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
  • 运行时常量池,常量池是*.class 文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址

运行时常量池里面#1,#2...这些会变成内存地址。

相关推荐
pjx9871 小时前
JVM 字节码与 JIT 编译详解
jvm
guangzhi06331 小时前
JVM堆介绍
jvm
18你磊哥1 小时前
java重点学习-JVM类加载器+垃圾回收
java·jvm
翔云1234563 小时前
Go语言的垃圾回收(GC)机制的迭代和优化历史
java·jvm·golang·gc
Yz98765 小时前
Hadoop里面MapReduce的序列化与Java序列化比较
java·大数据·jvm·hadoop·分布式·mapreduce·big data
pjx9877 小时前
JVM 性能调优与监控
jvm·测试工具
无奇不有 不置可否7 小时前
JVM基础篇学习笔记
java·jvm
pjx9877 小时前
JVM 案例研究与实战经验
jvm
zyt.com7 小时前
线程池总结
jvm
pjx98711 小时前
JVM 语言与生态
jvm