stackmap 帧的使用及其如何帮助字节码验证?

Use of stackmap frames and how it helps in byte code verification?

我一直在努力了解晦涩难懂的堆栈映射框架,它的作用是一次性验证动态加载的 class。

我发现非常有用的堆栈溢出答案和其他资源很少

  1. Is there a better explanation of stack map frames?

  2. What kind of Java code requires stackmap frames?

  3. http://chrononsystems.com/blog/java-7-design-flaw-leads-to-huge-backward-step-for-the-jvm

我理解以下 -

  1. 每个基本块都应以堆栈映射框架开始。
  2. 紧跟在无条件分支(它是基本块的开始)之后的每条指令都应该有一个堆栈映射框架。
  3. ASM创建堆栈映射框架的算法。 Section 3.5 的 ASM 文档

所有这些文章的缺点是它没有描述堆栈映射框架在验证中究竟是如何使用的。

更具体地说—— 假设我们有一个如下所述的字节码。在当前位置,操作数堆栈将为空,局部变量 1 的类型将为 B。位置 L0 具有关联的堆栈映射框架。验证者如何使用这些信息?

    <initial frame for method>
    GETSTATIC B.VALUE
    ASTORE 1 
    GOTO L0 <- Current location
    <stack map frame>
L1  GETSTATIC A.VALUE
    ASTORE 1
    <stack map frame>
L0  ILOAD 0
    IFNE L1
    <stack map frame>
    ALOAD 1
    ARETURN

注意: 请注意,我确实通读了 JVM 规范,但不幸地未能理解堆栈映射框架。任何帮助都会非常有帮助。

在字节码的每一点,局部变量和操作数栈中的每一项都有一个隐式类型。在旧系统下,验证器一边计算一边计算这些类型,但如果控制流倒退,这可能会改变目标的类型,这意味着它必须迭代直到收敛。

现在,在此类跳转目标中明确指定了类型。验证器对字节码进行一次线性传递。每当它到达堆栈帧时,它都会断言当前推断的类型与堆栈帧中的显式类型兼容,然后继续使用堆栈帧类型。每当它到达一个跳转时,它断言跳转目标处的堆栈帧具有与当前推断类型兼容的类型。

本质上,堆栈帧显式存储 "iterating to convergence" 的结果,这意味着验证者无需计算它们,而只是检查结果是否正确,这可以一次性完成。

除此之外,较新的类文件不允许使用 jsrret 指令,这使得验证变得非常非常容易。

举个具体的例子,假设你有如下代码

.method static foo : ()V
L0: aconst_null
L1: astore_0
L2: new Foo
L3: dup
L4: invokespecial Method Foo <init> ()V
L5: astore_0
L6: goto L2
.end method

在推理验证下,验证者最初会在L2推断出var 0的类型为NULL。一旦到达 L6,它必须返回并将类型更改为 Foo。

在堆栈映射验证下,验证器将再次初步推断 var 0 的类型在 L2 处为 NULL。但是,它看到 L2 处有一个堆栈帧,并检查堆栈帧中 0 的类型。不管是什么,它都会将 0 设置为该类型并继续检查。当它到达 L6 时,它查看跳转目标(L2)的堆栈帧,并断言 L6 处的 0 类型(即 Foo)可分配给 L2 处的 0 类型(在堆栈中指定L2 的帧)。

假设L2 处的堆栈帧声明0 的类型为Object。然后stackmap验证器在每一步推断出以下类型

L0: INVALID (unset)
L1: INVALID (unset)
L2: NULL
(checks stack frame at L2)
(assert that NULL is assignable to Object)
L2: Object
L3: Object
L4: Object
L5: Object
L6: Foo
(check stack frame at L2)
(assert that Foo is assignable to Object)