JVM——引言+JVM内存结构

引言

什么是JVM

定义:

Java VirtualMachine -java 程序的运行环境 (ava 二进制字节码的运行环境)

好处:

  • 一次编写,到处运行
  • 自动内存管理,垃圾回收功能
  • 数组下标越界检查,
  • 多态

比较:

jvm jre jdk

学习jvm的作用

  • 面试
  • 理解底层实现原理
  • 中高级程序员的必备技能

常见的jvm

自己百度查找

jvm的组成

内存结构

程序计数器

定义

Program Counter Register 程序计数器(寄存器)

作用

如下图所示

右边就是简单的java代码打印操作,编译成左侧的二进制字节码。

经过解释器------>机器码------>CPU执行。

程序计数器在这里面的作用就是记住下一条jvm指令的执行地址。

第一条指令地址是0,第一条指令交给解释器去执行的同时会把第二条指令的地址3放入程序计数器。第一条执行完之后,解释器会去取出3来执行......

物理实现: 通过CPU中寄存器(速度快)实现

特点:

线程私有

每个线程都有自己的程序计数器。

每一个线程会有被分配一个时间片,在当前时间片内不能执行完会去执行别的线程的代码,直到轮到下一个时间片。

切换到别的线程时要记住当前执行到哪里,还是要用到程序计数器。通过私有的程序计数器知道下一行代码的地址。

唯一不会存在内存溢出的区

虚拟机栈

栈是一种普通的先进后出的数据结构。

java的虚拟机栈则是线程运行需要的内存空间

一段代码有多个方法组成,一个栈帧表示一次方法的调用,栈帧就是每个方法运行需要的内存。

运行:调用第一个方法时会给第一个方法划分一个栈帧空间,并压入栈内,执行完后会出栈,也会释放该方法占用的内存。

然后方法1调用方法2时会产生一个方法2的栈帧并入栈,然后方法2调用方法3也会产生并入栈,如下图所示。

定义

Java Virtual Machine Stacks (Java 虚拟机栈)

  • 每个线程运行时所需要的内存,称为虚拟机栈
  • 每个栈由多个栈帧 (Frame) 组成,对应着每次方法调用时所占用的内存
  • 每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法

栈帧大小由方法里的参数以及局部变量的个数决定

问题辨析

1.垃圾回收是否涉及栈内存?

栈内存是一次次方法调用产生的栈帧内存,调用结束后会弹出栈,会自动回收,不需要垃圾回收 管理,垃圾回收是回收堆内存中的无用对象。

2.栈内存分配越大越好吗?

运行java代码时是可以指定栈内存大小的,使用-Xss size,下图还有不同系统下默认栈内存的大小和设定内存的示例。

栈内存越大会让线程数变少,512mb的物理内存下,每个线程的栈内存设置1mb大小可以运行512个,设置2mb大小可以运行256个线程。不会提高线程效率,但可以增加递归的层数。

3.方法内的局部变量是否线程安全?

根据该变量是每个线程共享还是线程私有判断。下图是一个方法,方法内有一个局部变量。

该方法被调用两次时会有两个不同的栈。每个线程都会有私有的局部变量。因此这里不会有线程干扰的问题。

假如将x改为static int x=0;的话就会出现线程干扰,如果不加保护的话会有线程安全问题。

总结:共享需要考虑线程安全,私有就不需要考虑。

  • 如果方法内的局部变量没有逃离方法的作用范围,则是线程安全。
  • 如果是局部变量引用了对象,并逃离方法的作用方法,需要考虑线程安全(引用传递和值传递的问题)

栈内存溢出

  • 栈帧过多导致栈内存溢出(栈帧过多爆栈) : 通常在的递归导致。
  • 单片栈帧过大导致栈内存溢出(太大了,已经塞满了)

一般不会有单片过大,栈帧里都是方法参数和局部变量。可以通过设置栈内存大小达到

在将对象转换成json对象时也会有栈溢出,这种两个类的循环问题会导致json解释器出现问题。

可以通过一个@JsonIgnore注解达到在json转换对象时忽略变量的效果。

线程运行诊断

案例1: cpu 占用过多

linux环境下运行一段java代码导致cpu占用过高,可以使用top命令定位到哪一个进程占用,但看不见是哪一个线程导致的。

在linux下使用ps H -eo pid,tid,%cpu命令可以看见所有线程的pid(进程号),tid(线程号),%cpu(cpu占用)。

使用ps H -eo pid,tid,%cpu | grep 32655 后面加上| grep pid过滤无关进程的线程。

  • 用top定位哪个进程对cpu的占用过高
  • ps H -eo pid,tid,%cpu | grep pid (用ps命令进一步定位是哪个线程引起的cpu占用过高)
  • jstack 进程id (可以根据线程id 找到有问题的线程,进一步定位到问题代码的源码行号)

生产环境不推荐jstack,因为打印线程信息jvm会暂停其他线程

然后将线程编号32665转换成16进制(7F99)在输出内容中查找

在jstack 输出内容中可以看见一个nid=Ox7f99的线程,状态为RUNNABLE.

看见问题出在第8行代码。如下图源码第8行是个死循环。

nid、pid 和 tid 是计算机系统中常用的三个标识

  • nid (Node ID) 是指在分布式系统中,每个节点的唯一标识
  • pid (Process ID) 是指操作系统中每个进程的唯一标识。
  • tid (Thread ID) 是指操作系统中每个线程的唯一标识。

案例2: 程序运行很长时间没有结果

线程死锁导致的无结果下使用jstack命令查看,下输出内容最后可以看见有关死锁信息。

两个线程都想获得a,b,但是都在等对方放开拥有的对象,然后陷入死锁。

产生死锁的四个必要条件:互斥、不可剥夺、请求和保持、循环等待。

本地方法栈

定义: java虚拟机在调用本地方法时需要给本地方法提供的内存空间

在Object这个类中就有很多,比如Object的clone方法的声明是native,这个native的实现是c/c++,java代码是间接调用native

定义

通过 new 关键字,创建对象都会使用堆内存

特点:

  • 它是线程共享的,堆中对象都需要考虑线程安全的问题
  • 有垃圾回收机制 (不再被引用的对象会被回收)

堆内存溢出

下图所示方法中String类型的对象a会一次次变大,直至堆溢出。

运行结果: 溢出内存错误: java 堆 空间

使用**-Xmx size**改变堆空间大小。

修改前26次才溢出,修改后17次溢出。

有可能堆内存较大,运行时间短,在系统前期看不出问题,后期才会爆掉,故测试时可以将堆内存设置较小进行排查。

堆内存诊断

相关工具:

1.jps 工具

查看当前系统中有哪些 java 进程

  1. jmap 工具

查看堆内存占用情况 jmap -heap 进程id(只能看某一瞬间的情况)

3.jconsole 工具

图形界面的,多功能的监测工具,可以连续监测

4.jvisualVM 工具

图形化界面,可以抓取当前快照

案例1

new一个10MB的数组对象,后面置为null,然后gc显式回收。

运行后通过jps查看进程id,jmap -heap 18756在1~2,2~3,3之后三个时间点抓取快照信息。

最大堆内存占用MaxHeapSize是4个G

Eden Space就是专门为new 出来的对象准备的。

1~2之间

数组创建之前使用了6Mb

2~3之间

创建数组对象之后使用16mb,

3之后

垃圾回收之后变成1.2mb

使用jconsole工具的界面。

案例2

垃圾回收之后,内存占用任然很高。

新生代被回收了,老年代没有被回收。

新生代剩8mb

老年代剩200mb

使用新的工具jvisualvm可视化虚拟机

保存快照之后进行查找最大的类

查看最大的ArrayList实例的具体信息

源代码

两百个Student对象,每个都开了一个1mb大小的byte数组。并且一直在作用范围内,无法回收,内存占用居高不下。

通过可视化界面的堆 dump按钮进行排查。

方法区

定义

按照jdk_jvm_1.8中的定义

  • 方法区是所有java虚拟区线程共享的区域。
  • 存储了和类的结构相关的信息。
  • 有成员变量filed,method data方法数据,成员方法、构造器方法的代码以及运行时常量值run-time constant pool等等
  • 在虚拟机启动时被创建
  • 逻辑上是堆的组成部分(1.8以前用的堆内存,1.8以后用的是系统内存
  • 方法区也会导致内存溢出

组成

永久代和元空间都是方法区这个概念的实现。

永久代和元空间最本质的区别就是 前者使用的是jvm内存 后者使用的是操作系统内存。

图中常量池是运行时常量池。

方法区内存溢出

  • 1.8 以前会导致永久代内存溢出
  • 1.8 之后会导致元空间内存溢出

下图代码就是一个加载了10000个类的代码,最外层继承实现了类加载器,在循环内指定版本号,类名,包名,父类,接口等信息创建一个新类。

这里元空间和永久代都没有设置上限,这里需要设置元空间和永久代大小。

-XX:MaxMetaspaceSize=8m 元空间

-XX:MaxPermSize=8m 永久代

元空间运行报异常

永久代报异常

场景:

  • spring
  • mybatis

spring和mybatis都使用到了cglib技术。

运行时常量池

下面的这段代码的二进制字节码含有如下信息。

使用如下命令查看该代码反编译后的结果

javap -v HelloWorld.class

常量池部分

虚拟机指令部分

执行指令时下面第一条就是获取静态变量,#2在常量池里面找。

ldc是找到一个引用地址。

定义:

  • 常量池,就是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息
  • 运行时常量池,常量池是*.class 文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址

运行时常量池里面#1,#2...这些会变成内存地址。

相关推荐
阿伟*rui5 小时前
jvm入门
jvm
学点东西吧.8 小时前
JVM(五、垃圾回收器)
jvm
请你打开电视看看10 小时前
Jvm知识点
jvm
程序猿进阶11 小时前
堆外内存泄露排查经历
java·jvm·后端·面试·性能优化·oom·内存泄露
阿龟在奔跑1 天前
引用类型的局部变量线程安全问题分析——以多线程对方法局部变量List类型对象实例的add、remove操作为例
java·jvm·安全·list
王佑辉1 天前
【jvm】方法区常用参数有哪些
jvm
王佑辉1 天前
【jvm】HotSpot中方法区的演进
jvm
Domain-zhuo1 天前
什么是JavaScript原型链?
开发语言·前端·javascript·jvm·ecmascript·原型模式
Theodore_10222 天前
7 设计模式原则之合成复用原则
java·开发语言·jvm·设计模式·java-ee·合成复用原则
我是苏苏2 天前
Web开发:ORM框架之使用Freesql的DbFrist封装常见功能
java·前端·jvm