JVM工作原理与实战(三):字节码文件的组成

前言

JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。本文主要介绍了字节码文件的基础信息、常量池、方法、字段、属性等内容。


一、基础信息

字节码文件的基础信息包括魔数、字节码文件对应的Java版本号、访问标识(public final等等)、父类和接口内容。

1.Magic魔数

文件是无法通过文件扩展名来确定文件类型的,文件扩展名可以随意修改,不影响文件的内容。软件使用文件的头几个字节(文件头)去校验文件的类型,如果软件不支持该种类型就会出错。在Java字节码文件中,将文件头称为magic魔数

文件类型 字节数 文件头
JPEG (jpg) 3 FFD8FF
PNG (png) 4 89504E47(文件尾也有要求)
bmp 2 424D
XML (xml) 5 3C3F786D6C
AVI (avi) 4 41564920
Java字节码文件 (.class) 4 CAFEBABE

通过NotePad++使用十六进制插件查看class文件:

2.主副版本号

版本号用于标识字节码文件的版本。它包括主版本号和副版本号。主版本号表示编译字节码文件的JDK版本,而副版本号则用于标识不同版本的字节码文件。通过比较字节码文件的主版本号和运行时的JDK版本,可以判断两者是否兼容。

JDK1.0-1.1使用了 45.0-45.3,JDK1.2是46之后每升级一个大版本就加1。1.2之后大版本号计算方法为主版本号 - 44,比如主版本号52就是JDK8。

3.其他信息

访问标识:在Java字节码文件中用于描述类的访问权限和特性。它包括public、private、protected和默认(无标识)等访问级别,以及final、abstract、interface等修饰符。这些标识确定了类的可见性和行为特性,影响着类的使用和继承。

类、父类、接口索引:在字节码文件中,父类和接口的内容通过索引值来表示。这些索引值指向类或接口在常量池中的位置,以便在运行时能够找到它们的相关信息。通过这些索引值,JVM可以在运行时加载并链接所需的类和接口,从而正确执行程序。

二、常量池

常量池是字节码文件中的一个重要组成部分,主要用于存储程序中的常量值,如字符串常量、类或接口名、字段名等。常量池的主要作用是避免相同的内容在字节码文件中重复定义,从而节省空间

在字节码指令中,可以通过常量池中的编号引用相应的常量值。每个常量在常量池中都有一个唯一的编号,编号从1开始。通过这些编号,字节码指令可以快速地定位到常量池中的数据,从而实现高效的数据访问。在字节码指令中引用常量池的过程称为符号引用。通过符号引用来替代实际的数据值,可以在运行时动态地解析和加载相应的数据,提高程序的灵活性和可维护性。

1.案例解析

案例一:

案例代码:

arduino 复制代码
public class ConstantPoolTest {
    public static final String a1 = "This is a test";
    public static final String a2 = "This is a test";
    public static void main(String[] args) {
        ConstantPoolTest constantPoolTest = new ConstantPoolTest();
    }
}

查看字段常量值索引(a1和a2),指向cp_info #8:

进入常量池cp info #8,看到字符串文本内容在cp_info #27:

进入常量池cp_info #27,可以看到字符串文本内容:

在上面的示例中,字符串常量"This is a test"在常量池中只存储一次。在字节码指令中,可以通过常量池中的编号来引用这两个常量。因此,常量池避免了相同内容的重复定义,节省了存储空间。

案例二:

案例代码:

arduino 复制代码
public class ConstantPoolTest2 {
    public static final String a1 = "abc";
    public static final String a2 = "abc";
    public static final String abc = "abc";
    public static void main(String[] args) {
        ConstantPoolTest2 constantPoolTest = new ConstantPoolTest2();
    }
}

查看字段常量值索引,指向cp_info #8:

进入常量池cp info #8,看到字符串文本内容在cp_info #10:

进入常量池cp_info #10,可以看到字符串文本内容:

查看字段abc名称所在常量池,指向cp_info #10:

三、方法

1.方法介绍

在JVM字节码文件中,方法部分是核心,它包含了程序执行的具体指令。这些指令是以字节码的形式存在的,是Java源代码的编译结果。

  • 字节码指令:字节码中的方法区域是存放字节码指令的核心位置,字节码指令的内容存放在方法的Code属性中。
  • 操作数栈: 操作数栈在字节码指令执行中起到关键的作用。它是一个后进先出(LIFO)的数据结构,用于临时存储数据。几乎所有的字节码指令都会用到操作数栈,无论是从栈顶弹出数据,还是将数据压入栈中。
  • 局部变量表: 局部变量表是存放方法中定义的局部变量的位置。每个方法在JVM中都有一个关联的局部变量表,这个表定义了方法的参数和在方法体内部声明的局部变量。局部变量表中的每个条目都包含一个变量的名称、类型和其在方法中的偏移量。这个偏移量表示该变量在方法栈帧中的位置。
  • 局部变量表数组:局部变量表数组是存放这些局部变量表的数组。每一个方法对应一个局部变量表,该表记录了该方法的所有局部变量的信息,包括它们的名称、类型和偏移量等。这些信息对于JVM在运行时解析字节码和执行相应的操作非常重要。

右键查看JVM规范:

JVM规范:

2.案例解析

案例一:

案例代码:

arduino 复制代码
public class Demo1 {
    public static void main(String[] args) {
        int i=0;
        i = i++;
    }
}

查看方法的字节码信息:

字节码信息解析:

iconst_0 将0放入操作数栈
istore_1 从操作数栈取出放入局部变量表1号位置
iload_1 从局部变量表1号位置加载数据到操作数栈
iinc 1 by 1 在局部变量表1号位置增加1
istore_1 将操作数栈中的值保存到局部变量表
return 方法结束,返回

案例二:

案例代码:

arduino 复制代码
public class Demo2 {
    public static void main(String[] args) {
        int i = 0;
        int j = i + 1;
    }
}

查看方法的字节码信息:

字节码信息解析:

iconst_0 将常量0放入操作数栈
istore_1 从操作数栈取出放入局部变量表1号位置
iload_1 将局部变量表1中的数据放入操作数栈
iconst_1 将常量1放入操作数栈
iadd 将操作数栈顶部的两个数据进行累加,结果放入栈中
istore_2 从操作数栈取出放入局部变量表2号位置
return 方法结束,返回

四、字段

在JVM字节码文件中,字段部分包含了当前类或接口声明的字段信息。这些字段包括类的成员变量、静态变量、常量等。字段信息在类的字节码文件中被组织为一个字段表,每个字段在表中都有一个唯一的字段表条目。

五、属性

在JVM字节码文件中,属性部分包含了描述类或接口的各种元数据信息。这些属性提供了关于类或接口的附加信息,用于支持某些JVM特性和工具。

常见的属性:

  • 源码的文件名:这个属性提供了类的源文件名,可以帮助调试和错误跟踪。它允许开发人员在运行时与源代码对应,这对于理解和调试代码非常有用。
  • 内部类的列表:如果一个类包含内部类或嵌套类,那么这个属性将列出所有的内部类和嵌套类。这对于解析和执行嵌套类非常关键。
  • 注解:注解是一种提供元数据的方法,可以用于标记代码中的特定元素。在字节码文件中,注解被表示为属性,提供了关于类、方法、字段等的额外信息。
  • 签名:这个属性提供了关于类、方法或字段的签名信息,包括它们的名称和类型。这对于验证类型和调用方法非常重要。
  • 其他属性:还有其他一些属性,如行号表、本地变量表等,这些属性用于支持调试和其他高级功能。

总结

JVM是Java程序的运行环境,负责字节码解释、内存管理、安全保障、多线程支持、性能监控和跨平台运行。本文主要介绍了字节码文件的基础信息、常量池、方法、字段、属性等内容,希望对大家有所帮助。

相关推荐
顾北川_野7 分钟前
Android 手机设备的OEM-unlock解锁 和 adb push文件
android·java
江深竹静,一苇以航9 分钟前
springboot3项目整合Mybatis-plus启动项目报错:Invalid bean definition with name ‘xxxMapper‘
java·spring boot
confiself25 分钟前
大模型系列——LLAMA-O1 复刻代码解读
java·开发语言
Wlq041530 分钟前
J2EE平台
java·java-ee
XiaoLeisj37 分钟前
【JavaEE初阶 — 多线程】Thread类的方法&线程生命周期
java·开发语言·java-ee
杜杜的man40 分钟前
【go从零单排】go中的结构体struct和method
开发语言·后端·golang
幼儿园老大*41 分钟前
走进 Go 语言基础语法
开发语言·后端·学习·golang·go
llllinuuu43 分钟前
Go语言结构体、方法与接口
开发语言·后端·golang
cookies_s_s43 分钟前
Golang--协程和管道
开发语言·后端·golang
为什么这亚子1 小时前
九、Go语言快速入门之map
运维·开发语言·后端·算法·云原生·golang·云计算