写自己的JVM(0x6)- 方法调用与参数传递

原始博客的地址:

lyldalek.notion.site/JVM-0x6-fa2...

该项目的地址:

github.com/aprz512/wri...

前面我们基本完成了方法区的实现,现在我们需要搞定方法的调用。

在Java虚拟机支持以下5条方法调用字节码指令,分别是:

  • invokestatic:用于调用静态方法。
  • invokespecial:用于调用实例构造器()方法、私有方法和父类中的方法。
  • invokevirtual:用于调用所有的虚方法。
  • invokeinterface:用于调用接口方法,会在运行时再确定一个实现该接口的对象。
  • invokedynamic:先在运行时动态解析出调用点限定符所引用的方法,然后再执行该方法。这个比较麻烦,我们后面单独开一篇来说。

只要能被invokestaticinvokespecial指令调用的方法,都可以在解析阶段中确定唯一的调用版本,Java语言里符合这个条件的方法共有静态方法、私有方法、实例构造器、父类方法4种,再加上被final修饰的方法(尽管它使用invokevirtual指令调用),这5种方法调用会在类加载的时候就可以把符号引用解析为该方法的直接引用。这些方法统称为"非虚方法"(Non-Virtual Method),与之相反,其他方法就被称为"虚方法"(Virtual Method)。

invokestatic

假定解析符号引用后得到方法M。M必须是静态方法,否则抛出Incompatible-ClassChangeError异常。M不能是类初始化方法。类初始化方法只能由Java虚拟机调用,不能使用invokestatic指令调用。这一规则由class文件验证器保证,这里不做检查。如果声明M的类还没有被初始化,则要先初始化该类。

代码实现:

ini 复制代码
  @Override
    public void execute(StackFrame frame) {
        ConstantPool constantPool = frame.getMyMethod().getMyClass().getConstantPool();
        ConstantPool.Constant constant = constantPool.getConstant(operand);
        MethodRef methodRef = (MethodRef) constant.value;
        MyMethod resolvedMethod = methodRef.getResolvedMethod();
        if (!resolvedMethod.isStatic()) {
            throw new MyJvmException("java.lang.IncompatibleClassChangeError");
        }
        MyClass resolvedClass = methodRef.getResolvedClass();
        if (!resolvedClass.isInitStarted()) {
            frame.revertPc();
            ClassInit.initMyClass(resolvedClass, frame.getThread());
            return;
        }

        InvokeMethod.invokeMethod(frame, resolvedMethod);
    }

这里我们封装了一些方法调用的逻辑 InvokeMethod ,它主要是处理栈帧与参数的传递。

参数传递

当调用一个方法的时候,所以我们根据方法的 descriptor 算出参数的个数,由于解析比较麻烦,具体可看 MethodDescriptorParser里面的逻辑,简单来说就是分割字符串。举个例子,对于下面的方法:

arduino 复制代码
public static void func(int a, String b, double c, float[] d) {

}

编译后的 descriptor(ILjava/lang/String;D[F)V 。将这个字符串分割后,就可以拿到方法的参数类型与个数,也可以拿到返回值类型。

参数的传递过程,其实就是将调用者栈帧的操作数栈中 pop 出数据,放入到被调用者栈帧的局部变量表中:

计算的时候,注意区分以下静态方法与实例方法,因为实例方法是有隐藏的 this 参数的,所以它的参数个数需要加1。

将参数放入被调用方法的局部变量表中,被调用方法就能正确使用吗?回想一下我们实现解释器的时候,有一些指令都是从局部变量表中取出值来使用,所以参数会被正确使用,当然这里面有一半的功劳要给编译器。

代码实现:

scss 复制代码
  public static void invokeMethod(StackFrame invokerFrame, MyMethod method) {
        MyThread thread = invokerFrame.getThread();
        StackFrame invokedFrame = thread.newStackFrame(method);
        thread.pushStackFrame(invokedFrame);
        int argSlotCount = method.getArgsSlotCount();
        if (argSlotCount > 0) {
            // 操作数栈上的参数:
            // arg3
            // arg2
            // arg1
            // 传递给调用的方法需要按照 index 对应,第一个参数设置到 index 为 0 的位置
            // 实例方法,通常 index 为 0 的位置是 this
            for (int i = argSlotCount - 1; i >= 0; i--) {
                Slot slot = invokerFrame.getOperandStack().popSlot();
                invokedFrame.getLocalVariableTable().setSlot(i, slot);
            }
        }
    }

里面除了参数传递之外,额外做了 一件事情,就是创建被调用方法的栈帧

invokespecial

invokespecialinvokestatic 类似,它调用的方法是在解析的时候就确定的,不需要等到运行时再确定。所以,其实现逻辑与invokestatic 也差不多。

scss 复制代码
public class InvokeSpecial extends Operand1Instruction {

    public InvokeSpecial(CodeReader reader) {
        super(reader);
    }

    @Override
    public int getOpCode() {
        return 0xb7;
    }

    @Override
    public void execute(StackFrame frame) {
        ConstantPool constantPool = frame.getMyMethod().getMyClass().getConstantPool();
        ConstantPool.Constant constant = constantPool.getConstant(operand);
        MethodRef methodRef = (MethodRef) constant.value;
        MyMethod resolvedMethod = methodRef.getResolvedMethod();
        MyClass resolvedClass = methodRef.getResolvedClass();
        MyClass currentClass = frame.getMyMethod().getMyClass();

        // ..., objectref, [arg1, [arg2 ...]] →
        OperandStack operandStack = frame.getOperandStack();
        MyObject ref = operandStack.getRefFromTop(resolvedMethod.getArgsSlotCount() - 1);
        if (ref == null) {
            throw new MyJvmException("java.lang.NullPointerException");
        }

        // 确保protected方法只能被声明该方法的类或子类调用
        if (resolvedMethod.isProtected()
                && resolvedClass.isSuperClassOf(currentClass)
                && !resolvedClass.getPackageName().equals(currentClass.getPackageName())
                && ref.getMyClass() != currentClass
                && !ref.getMyClass().isSubClassOf(currentClass)) {
            throw new MyJvmException("java.lang.IllegalAccessError");
        }

        MyMethod lookupMethod = resolvedMethod;
        if (currentClass.isSuper() && resolvedClass.isSuperClassOf(currentClass)
                && !resolvedMethod.getName().equals("<init>")) {
            lookupMethod = MethodRef.lookupMethodInClass(currentClass.getSuperClass(), resolvedMethod.getName(), resolvedMethod.getDescriptor());
        }
        if (lookupMethod == null || lookupMethod.isAbstract()) {
            throw new MyJvmException("java.lang.AbstractMethodError");
        }
        InvokeMethod.invokeMethod(frame, lookupMethod);
    }

    @Override
    public String getReadableName() {
        return "invokespecial";
    }

    @Override
    protected int readOperand(CodeReader reader) {
        return reader.readUnsignedShort();
    }
}

相比invokestatic 来说,多了一些校验代码,做了一些条件检查,为啥要做这些条件检查呢?我们可以看看官方文档的说明,截取一个片段:

invokevirtual

这个指令就比较麻烦了,涉及到一个叫做"分派"的概念。分派又分为两种,一种是静态分派,一种是动态分派。

静态分派

看一个例子:

java 复制代码
public class StaticDispatch {

    static abstract class Human {
    }

    static class Man extends Human {
    }

    static class Woman extends Human {
    }

    public void sayHello(Human guy) {
        System.out.println("hello,guy!");
    }

    public void sayHello(Man guy) {
        System.out.println("hello,gentleman!");
    }

    public void sayHello(Woman guy) {
        System.out.println("hello,lady!");
    }

    public static void main(String[] args) {
        Human man = new Man();
        Human woman = new Woman();
        StaticDispatch sr = new StaticDispatch();
        sr.sayHello(man);
        sr.sayHello(woman);
    }

}

直接看编译后的字节码:

可以看到mian方法中调用 sayHello 时,编译器选择的是 Human 作为参数的函数。为啥会这样呢?

我们把上面代码中的"Human"称为变量的"静态类型"(Static Type),把后面的"Man"则被称为变量的"实际类型"(Actual Type)。虚拟机(或者准确地说是编译器)在重载时是通过参数的静态类型而不是实际类型作为判定依据的。由于静态类型在编译期可知,所以在编译阶段,Javac编译器就根据参数的静态类型决定了会使用哪个重载版本,因此选择了sayHello(Human)作为调用目标,并把这个方法的符号引用写到main()方法里的两条invokevirtual指令的参数中。

所有依赖静态类型来决定方法执行版本的分派动作,都称为静态分派。静态分派的最典型应用表现就是方法重载。

重载方法还有优先级一说,比如一个参数是 int,一个参数是short,这个时候该选择哪个函数就需要一些规则来判断。具体的内容可以自行查询。

动态分派

动态分派与Java语言多态性的另外一个重要特性------重写(Override)有着很密切的关联。看例子:

java 复制代码
public class DynamicDispatch {

    static abstract class Human {
        protected abstract void sayHello();
    }

    static class Man extends Human {
        @Override
        protected void sayHello() {
            System.out.println("man say hello");
        }
    }

    static class Woman extends Human {
        @Override
        protected void sayHello() {
            System.out.println("woman say hello");
        }
    }

    public static void main(String[] args) {
        Human man = new Man();
        Human woman = new Woman();
        man.sayHello();
        woman.sayHello();
        man = new Woman();
        man.sayHello();
    }

}

看编译后的字节码:

发现三个 sayHello 方法的调用都是 Human 方法的。但是我们知道,这肯定是不对的。sayHello 的输出是与实际的调用对象有关的。

静态类型同样都是Human的两个变量man和woman在调用sayHello()方法时产生了不同的行为。这是如何做到的呢?我们需要从 invokevirtual 指令入手:

根据《Java虚拟机规范》,invokevirtual指令的运行时解析过程大致分为以下几步:

  1. 找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。
  2. 如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果 通过则返回这个方法的直接引用,查找过程结束;不通过则返回java.lang.IllegalAccessError异常。
  3. 否则,按照继承关系从下往上依次对C的各个父类进行第二步的搜索和验证过程。
  4. 如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。

再看上面的字节码图,第16和20行的aload指令分别把刚刚创建的两个对象的引用压到栈顶,这两个对象是将要执行的sayHello()方法的所有者,也就是 C。由于C重写了 sayHello 方法,所以我们就可以将重写后的方法作为目标方法进行调用,这样就调用到了不同对象上的方法。

因为invokevirtual指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的invokevirtual指令并不是把常量池中方法的符号引用解析到直接引用上就结束了,还会根据方法接收者的实际类型来选择方法版本,这个过程就是Java语言中方法重写的本质。

代码实现

scss 复制代码
  @Override
    public void execute(StackFrame frame) {
        ConstantPool constantPool = frame.getMyMethod().getMyClass().getConstantPool();
        ConstantPool.Constant constant = constantPool.getConstant(operand);
        MethodRef methodRef = (MethodRef) constant.value;
        MyMethod resolvedMethod = methodRef.getResolvedMethod();
        MyClass resolvedClass = methodRef.getResolvedClass();
        MyClass currentClass = frame.getMyMethod().getMyClass();

        if (resolvedMethod.isStatic()) {
            throw new MyJvmException("java.lang.IncompatibleClassChangeError");
        }

        OperandStack operandStack = frame.getOperandStack();
        MyObject ref = operandStack.getRefFromTop(resolvedMethod.getArgsSlotCount() - 1);
        if (ref == null) {
            // System.out.println hack
            if ("println".equals(methodRef.getName())) {
                print(methodRef, operandStack);
                operandStack.popRef();
                return;
            }
            throw new MyJvmException("java.lang.NullPointerException");
        }

        // 确保protected方法只能被声明该方法的类或子类调用
        if (resolvedMethod.isProtected()
                && resolvedClass.isSuperClassOf(currentClass)
                && !resolvedClass.getPackageName().equals(currentClass.getPackageName())
                && ref.getMyClass() != currentClass
                && !ref.getMyClass().isSubClassOf(currentClass)) {
            throw new MyJvmException("java.lang.IllegalAccessError");
        }

        MyMethod lookupMethod = MethodRef.lookupMethodInClass(ref.getMyClass(), resolvedMethod.getName(), resolvedMethod.getDescriptor());
        if (lookupMethod == null || lookupMethod.isAbstract()) {
            throw new MyJvmException("java.lang.AbstractMethodError");
        }
        InvokeMethod.invokeMethod(frame, lookupMethod);

    }

其核心逻辑就在 MethodRef.lookupMethodInClass 里面,它会从下往上的从类的继承结构里面找匹配的方法,找到就返回。这里就又不得不提到另外一个知识点,就是 vtable。我们会发现,每次执行一个invokevirtual 指令的时候,都需要从下往上的寻找匹配方法,这岂不是显得很傻逼,所以呢我们可以做一个方法表。在我们的实现里面,方法表其实就可以看成一个缓存来实现,或者参考虚拟机规范来实现。但是项目里面并没有实现这个vtable逻辑,有兴趣的可以pr。

invokeinterface

和其他三条方法调用指令略有不同,在字节码中,invokeinterface指令的操作码后面跟着4字节而非2字节。前两字节的含义和其他指令相同,是个uint16运行时常量池索引。第3字节的值是给方法传递参数需要的slot数,其含义和给Method结构体定义的argSlotCount字段相同。这个数是可以根据方法描述符计算出来的,它的存在仅仅是因为历史原因。第4字节是留给Oracle的某些Java虚拟机实现用的,它的值必须是0。该字节的存在是为了保证Java虚拟机可以向后兼容。

ini 复制代码
  public InvokeInterface(CodeReader codeReader) {
        index = codeReader.readUnsignedShort();
        // must not be zero
        count = codeReader.readUnsignedByte();
        // must always be zero
        zero = codeReader.readByte();
    }

具体的核心执行逻辑其实是与 invokevirtual 一样的,只不过校验的东西不一样:

ini 复制代码
  @Override
    public void execute(StackFrame frame) {
        ConstantPool constantPool = frame.getMyMethod().getMyClass().getConstantPool();
        ConstantPool.Constant constant = constantPool.getConstant(index);
        InterfaceMethodRef methodRef = (InterfaceMethodRef) constant.value;
        MyMethod resolvedMethod = methodRef.getResolvedInterfaceMethod();
        MyClass resolvedClass = methodRef.getResolvedClass();

        if (resolvedMethod.isStatic() || resolvedMethod.isPrivate()) {
            throw new MyJvmException("java.lang.IncompatibleClassChangeError");
        }

        OperandStack operandStack = frame.getOperandStack();
        MyObject ref = operandStack.getRefFromTop(resolvedMethod.getArgsSlotCount() - 1);
        if (ref == null) {
            throw new MyJvmException("java.lang.NullPointerException");
        }

        if (!ref.getMyClass().isImplement(resolvedClass)) {
            throw new MyJvmException("java.lang.IncompatibleClassChangeError");
        }

        MyMethod lookupMethod = MethodRef.lookupMethodInClass(ref.getMyClass(), methodRef.getName(), methodRef.getDescriptor());
        if (lookupMethod == null || lookupMethod.isAbstract()) {
            throw new MyJvmException("java.lang.AbstractMethodError");
        }

        if (!lookupMethod.isPublic()) {
            throw new MyJvmException("java.lang.IllegalAccessError");
        }
        InvokeMethod.invokeMethod(frame, lookupMethod);
    }

那么为什么要单独定义invokeinterface指令呢?统一使用invokevirtual指令不行吗?答案是,可以,但是可能会影响效率。这两条指令的区别在于:当Java虚拟机通过invokevirtual调用方法时,this引用指向某个类(或其子类)的实例。因为类的继承层次是固定的,所以虚拟机可以使用一种叫作vtable的技术加速方法查找。但是当通过invokeinterface指令调用接口方法时,因为this引用可以指向任何实现了该接口的类的实例,所以无法使用vtable技术。

测试

typescript 复制代码
public class Test07 implements Runnable {
    public static void main(String[] args) {
        new Test07().test();
    }

    public static void staticMethod() {
//        System.out.println("staticMethod");
    }

    public void test() {
        Test07.staticMethod(); // invokestatic
        Test07 demo = new Test07(); // invokespecial
        demo.instanceMethod(); // invokespecial
        super.equals(null); // invokespecial
        this.run(); // invokevirtual
        ((Runnable) demo).run(); // invokeinterface
    }

    private void instanceMethod() {
//        System.out.println("instanceMethod");
    }

    @Override
    public void run() {
//        System.out.println("run");
    }

}

程序编译无异常。再测试另外一个程序:

arduino 复制代码
public class Test072 {
    public static void main(String[] args) {
        long x = fibonacci(30);
        System.out.println(x);
    }

    private static long fibonacci(long n) {
        if (n <= 1) {
            return n;
        }
        return fibonacci(n - 1) + fibonacci(n - 2);
    }

    // 0 1 1 2 3 5 8 13

}

输出:

没有问题!!!

相关推荐
Martin -Tang14 分钟前
vite和webpack的区别
前端·webpack·node.js·vite
迷途小码农零零发15 分钟前
解锁微前端的优秀库
前端
王解1 小时前
webpack loader全解析,从入门到精通(10)
前端·webpack·node.js
我不当帕鲁谁当帕鲁1 小时前
arcgis for js实现FeatureLayer图层弹窗展示所有field字段
前端·javascript·arcgis
那一抹阳光多灿烂1 小时前
工程化实战内功修炼测试题
前端·javascript
放逐者-保持本心,方可放逐2 小时前
微信小程序=》基础=》常见问题=》性能总结
前端·微信小程序·小程序·前端框架
毋若成4 小时前
前端三大组件之CSS,三大选择器,游戏网页仿写
前端·css
红中马喽4 小时前
JS学习日记(webAPI—DOM)
开发语言·前端·javascript·笔记·vscode·学习
Black蜡笔小新5 小时前
网页直播/点播播放器EasyPlayer.js播放器OffscreenCanvas这个特性是否需要特殊的环境和硬件支持
前端·javascript·html
秦jh_6 小时前
【Linux】多线程(概念,控制)
linux·运维·前端