垃圾收集器如何更新推送到操作数堆栈的引用?

How does the Garbage Collector update the references pushed to the operand stack?

在堆中移动对象时,JVM 可以轻松更新局部变量、静态引用、class 实例或对象数组实例的引用。但是它如何更新推送到操作数堆栈的引用?

局部变量和操作数栈中的条目之间没有根本区别。两者都在同一个栈帧中。两者都没有正式声明,并且都需要 JVM 执行推理以识别它们的实际用途。

代码如下

public static void example() {
    {
        int foo = 42;
    }
    {
        Object bar = "text";
    }
    {
        long x = 100L;
    }
    {
        Object foo, bar = new Object();
    }
}

将(通常)编译为

  public static void example();
    Code:
       0: bipush        42
       2: istore_0
       3: ldc           #1                  // String text
       5: astore_0
       6: ldc2_w        #2                  // long 100l
       9: lstore_0
      10: new           #4                  // class java/lang/Object
      13: dup
      14: invokespecial #5                  // Method java/lang/Object."<init>":()V
      17: astore_1
      18: return

请注意堆栈帧中索引 0 处的局部变量如何重新分配不同类型的值。作为奖励,最后一次存储到变量索引 1 会使索引 0 处的变量无效,否则它会包含悬空的一半 long 值。

没有关于局部变量类型的额外提示,调试信息是可选的,堆栈映射表仅在代码包含分支时存在。

判断一个局部变量是否包含引用的唯一方法,就是顺着程序流程追溯指令的作用。这确实已经意味着推断操作数堆栈上的值,因为没有它,我们甚至不知道 store 指令将什么放入变量中。

验证者做,甚至是强制性的,垃圾收集器或任何JVM的支持代码也可以做。一个实现甚至可以有一个单独的分析代码来保存第一次分析的类型信息,这将是验证。

但即使每次垃圾收集器需要时都重建此信息,开销也不会是天文数字。垃圾收集器只定期运行,它只需要当前执行的方法的信息。这只是关于解释执行的全部内容。

当 JIT 编译器生成代码时,它无论如何都需要利用类型信息,并且可以为垃圾收集器准备信息,但它只会为某些称为 safepoints 的点这样做生成的代码检查是否存在未完成的垃圾回收。这意味着在这些点之间,数据不需要采用垃圾收集器可以理解的形式,优化后的代码可能会假设垃圾收集器在处理它们时不会重新定位对象。

这也意味着在经过编译的优化代码中,可达性可能与简单解释执行中的完全不同,即可能不存在未使用的变量,但即使从源代码的角度来看正在使用的对象在以下情况下也可能被视为未使用优化的代码适用于它们字段的副本,例如在 CPU 寄存器中。