来自java虚拟机指令dup的理解

    dup 指令的作用:dup 指令可以复制操作数栈栈顶的一个字,再将这个字压入栈。也就是对栈顶的内容做了个备份,此时操作数栈上有连续相同的两个对象地址。

    大家知道,JAVA/CLR 是完全基于栈的实现,任何操作都是入栈出栈,没有任何寄存器,所以如果要对某一操作数做两次连续操作,那就要复制两次栈顶操作数,比如:

    1. public class DupTest{
    2. public static void main(String[] args) {
    3. int x;
    4. int y = x = 2;
    5. }
    6. }

    当常数2被压入栈顶后,它要连续两次store到变量x和y,所以这里编译后肯定有一个dup操作,如下图所示:
    image.png
    iconst_2指令将数值2入操作数栈,然后用dup复制操作数栈栈顶的2,再将这个2压入栈。如此以来,istore_1将操作数栈出栈,取出的栈顶数字2存到局部变量表中的x,store_2将操作数栈出栈,取出的栈顶数字2存到局部变量表中的y。

    当然这在编译时对连续操作已经做dup操作了,所以不会真的出现这个情况。
    那么new 指令后,为什么一定要dup操作呢?
    因为java代码的new操作编译为虚拟机指令后,虚拟机指令new在堆上分配了内存并在栈顶压入了指向这段内存的地址供任何下面的操作来调用,但是在这个操作数被程序员能访问的操作之前,虚拟机自己肯定要调用对象的 方法,也就是如果程序员做一个 Type a = new Type(); 其实要连续两次对栈顶的操作数进行操作。其中一次是虚拟机内部自动调用的,另一次才是程序员的访问,例如给变量赋值,抛出异常等。

    测试代码:

    1. public class Test2 {
    2. public void test() {
    3. Test2 dt = new Test2();
    4. }
    5. }
    1. 其中new指令在java堆上为 Test2 对象分配内存空间,并将地址压入操作数栈顶;
    2. 然后dup指令为复制操作数栈顶值,并将其压入栈顶,也就是说此时操作数栈上有连续相同的两个对象地址;
    3. invokespecial指令调用实例初始化方法:()V,注意这个方法是一个实例方法,所以需要从操作数栈顶弹出一个DupTest 对象的引用,也就是说这一步会弹出一个之前入栈的对象地址;
    4. astore_1 指令从操作数栈顶取出 Test2 对象的引用并存到局部变量表;
    5. 最后由return指令结束方法。

    从上面的五个步骤中可以看出,需要从栈顶弹出两个实例对象的引用
    反编译结果:
    image.png
    抛出异常的示例:

    1. public class ExceptionTest{
    2. void cantBeZero(int i) throws Exception{
    3. throw new Exception();
    4. }
    5. }

    反编译结果:
    Java 虚拟机指令dup的理解 - 图3
    1) 其中new指令在java堆上为Exception对象分配内存空间,并将地址压入操作数栈顶;
    2) 然后dup指令为复制操作数栈顶值,并将其压入栈顶,也就是说此时操作数栈上有连续相同的两个对象地址;
    3) invokespecial指令调用实例初始化方法:()V,注意这个方法是一个实例方法,所以需要从操作数栈顶弹出一个this引用,也就是说这一步会弹出一个之前入栈的对象地址;
    4) athrow指令从操作数栈顶取出一个引用类型的值,并抛出;

    这种情况是99%以上存在的,而java 编译器是一种聪明的编译器,所以只要有 new 操作就优化为将对象的地址操作数DUP,第一次调用invokespecial 时会弹出一个,下面一个留给对该对象访问的操作,即使你的代码是:new Type();没有任何引用,有些虚拟机也会先 dup(不同版本编译结果不同),然后时弹出一个操作数,后面会立即pop掉被复制的那个操作数。这样的做目的是为了编译优化。代码和反编译结果如下:

    测试代码:

    1. public class DupTest {
    2. public void test() {
    3. new DupTest();
    4. }
    5. }


    反编译结果:
    Java 虚拟机指令dup的理解 - 图4
    可以看到,在仅仅调用了 new DupTest() 的情况下,java编译器仍然生成了一条 dup 指令,紧接着虚拟机调用了 方法,然后立即一条 pop 指令弹出了那个被复制的操作数。

    有人说那可以直接从栈顶先store到内存中,需要操作的时候再load到栈顶啊,注意在没有操作之前,这个对象对于程序员是不可见的,否则就会访问到残废的对象,所以只能是先然后才能store到内存中。这两步操作的操作数必须都直接是原来已经存在栈中的,所以只能是dup。