JVM 笔记 (一)介绍JVM

作为Java开发者，我们每天都在和JVM（Java虚拟机）打交道，但真正理解它的内部结构的人并不多。JVM是Java跨平台特性的基石，它负责加载、验证、执行字节码，并提供运行时环境。今天，我们就来深入剖析JVM的核心组成部分，重点讲解运行时数据区的划分以及各个组件的功能。

JVM主要由以下几个子系统组成：

下面我们逐一深入这些组件。

类加载器子系统是JVM的"入口"，它的任务是将外部的.class字节码文件加载到内存中。这个过程并不是简单的文件读取，而是经过三个步骤：加载、链接、初始化。

加载：通过类的全限定名获取此类的二进制字节流，将其转化为方法区中的数据结构，并在堆中生成一个对应的java.lang.Class对象作为方法区数据的访问入口。
链接：包括验证（确保字节码安全）、准备（为静态变量分配内存并设置默认值）、解析（将符号引用转为直接引用）。
初始化 ：执行类构造器<clinit>()方法，为静态变量赋初始值，执行静态代码块。

最终，类的元数据信息被存储到运行时数据区的方法区中。

运行时数据区是JVM管理的内存区域，根据用途不同划分为5个部分。其中方法区和堆是所有线程共享的，而虚拟机栈、本地方法栈和程序计数器是线程私有的。

方法区（Method Area）用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。它是各个线程共享的内存区域。

在JDK 8之前，方法区的实现被称为"永久代"（PermGen），但JDK 8之后完全移除了永久代，改用元空间（Metaspace）。元空间使用本地内存（Native Memory），而不是JVM堆内存，因此默认大小仅受本地内存限制，避免了永久代常见的内存溢出问题。

作用：存放类的元数据，相当于类的"档案库"。

堆（Heap）是JVM中最大的一块内存区域，也是垃圾收集器管理的主要区域。它被所有线程共享，几乎所有的对象实例和数组都在这里分配内存。

堆的逻辑划分（分代收集理论）：

新生代（Young Generation）：存放新创建的对象，又分为Eden区和两个Survivor区（From和To）。大多数对象在Eden区分配，经过Minor GC后存活的对象会被移入Survivor区。
老年代（Old Generation）：存放生命周期较长的对象，经过多次GC仍然存活的对象最终会进入老年代。

作用：运行时对象和数据的"仓库"。

虚拟机栈（Java Stack）是线程私有的，生命周期与线程相同。它描述的是Java方法执行的内存模型 ：每个方法在执行时都会创建一个栈帧（Stack Frame），用于存储局部变量表、操作数栈、动态链接、方法出口等信息。方法的调用到完成对应一个栈帧在虚拟机栈中的入栈和出栈。

栈帧的结构：

作用：支撑Java方法的执行，每个方法调用对应一次栈帧的压栈。

本地方法栈（Native Method Stack）与虚拟机栈的作用非常相似，区别在于虚拟机栈为Java方法服务，而本地方法栈为native方法服务。native方法是用其他语言（如C、C++）编写的，通过JNI（Java Native Interface）调用。

当线程调用native方法时，JVM会为它创建本地方法栈，用于记录本地方法执行时的状态。HotSpot虚拟机将本地方法栈和虚拟机栈合二为一，但概念上仍然是独立的。

程序计数器（Program Counter Register）是一块较小的内存空间，可以看作是当前线程所执行的字节码的行号指示器。字节码解释器通过改变这个计数器的值来选取下一条需要执行的字节码指令。

由于JVM的多线程是通过线程轮流切换并分配处理器执行时间的方式实现的，任何一个时刻一个处理器只能执行一条线程中的指令。因此，为了线程切换后能恢复到正确的执行位置，每条线程都需要有一个独立的程序计数器，各线程之间计数器互不影响，独立存储。

作用：记录线程执行的字节码地址，保证多线程环境下的正确切换。

本地方法接口（JNI，Java Native Interface）是JVM调用操作系统或底层硬件库的桥梁。Java中通过native关键字声明的方法就是本地方法，这些方法没有方法体，由非Java语言实现。

例如，java.lang.Thread类中的start0()方法就是native的，它调用了操作系统的线程创建函数。JNI的存在让Java具备了与底层交互的能力，但也意味着失去了跨平台的安全性。

执行引擎是JVM的核心部件之一，负责执行字节码指令。它包含三大组件：

执行引擎的优化是JVM性能的关键，现代JVM通常采用解释器与编译器混合的模式（如HotSpot的混合模式），在启动和运行时达到平衡。

JVM通过以上组件的协同工作，实现了Java"一次编写，到处运行"的承诺。类加载器将字节码载入内存，运行时数据区为程序执行提供内存空间，执行引擎负责执行指令，而本地方法接口则打通了Java与底层系统的通道。