在 java 编译器中标记行时出现问题

Problem marking the lines in the java compiler

我在读硕士,研究静态分析。 在我的一项测试中,我遇到了在 java 编译器中标记行的问题。

我有以下 java 代码:

 226:   String json = "/org/elasticsearch/index/analysis/commongrams/commongrams_query_mode.json";
 227:   Settings settings = Settings.settingsBuilder()
 228:           .loadFromStream(json, getClass().getResourceAsStream(json))
 229:           .put("path.home", createHome())
 230:           .build();

编译此代码并执行命令javap -p -v CLASSNAME时,我得到一个table,其中包含字节码中每条指令的相应源代码行。

见下图:

Bytecode table

问题是在调用.put (" path.home ", createHome ())方法时,字节码基本上生成了4条指令:

19: anewarray  
24: ldc - String path.home
30: invokespecial - createHome
34: invokevirtual - put

前两个标记为第 228 行(错误),后两个标记为第 229 行(正确)。

见下图:

Bytecode table

这是.put("path.home", createHome())方法的原始实现:

     public Builder put(Object... settings) {
        if (settings.length == 1) {
            // support cases where the actual type gets lost down the road...
            if (settings[0] instanceof Map) {
                //noinspection unchecked
                return put((Map) settings[0]);
            } else if (settings[0] instanceof Settings) {
                return put((Settings) settings[0]);
            }
        }
        if ((settings.length % 2) != 0) {
            throw new IllegalArgumentException("array settings of key + value order doesn't hold correct number of arguments (" + settings.length + ")");
        }
        for (int i = 0; i < settings.length; i++) {
            put(settings[i++].toString(), settings[i].toString());
        }
        return this;
    }

我已经尝试使用 Oracle-JDK v8 和 Open-JDK v16 编译代码,并且在这两个结果中。

我还通过删除参数对 put() 方法进行更改来进行测试。编译此代码时,未出现标记行的问题。

我想知道为什么字节码指令将229: .put (" path.home ", createHome ())行映射到java源代码中原始行以外的行?有谁知道这是不是故意的?

这是连接方式,行号关联存储在class文件和javac编译器的历史记录中。

line number table 仅包含将行号关联到标记其开头的代码位置的条目。因此,假定该位置之后的所有指令都属于同一行,直到 table.

中明确提到的下一个位置。

由于详细信息将占用 space 并且规范不要求行号的特定精度 table,因此编译器供应商对包含哪些详细信息做出了不同的决定。

过去,即最多 Java 7,javac 仅在 语句 的开头生成行号 table 的条目,所以当我用 Java 7 的 javac

编译以下代码时
String settings = new StringBuilder() // this is line 7 in my .java file
    .append('a')
    .append(
      5
      +
      "".length())
    .toString();

我得到了类似的东西

stack=3, locals=2, args_size=1
   0: new           #2                  // class java/lang/StringBuilder
   3: dup
   4: invokespecial #3                  // Method java/lang/StringBuilder."<init>":()V
   7: bipush        97
   9: invokevirtual #4                  // Method java/lang/StringBuilder.append:(C)Ljava/lang/StringBuilder;
  12: iconst_5
  13: ldc           #5                  // String
  15: invokevirtual #6                  // Method java/lang/String.length:()I
  18: iadd
  19: invokevirtual #7                  // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder;
  22: invokevirtual #8                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
  25: astore_1
  26: return
LineNumberTable:
  line 7: 0
  line 14: 26

这将导致属于该语句的所有指令仅与第 7 行关联。

这被认为太少了,因此从 Java 8 开始,javac 为跨越多个表达式的 方法调用 生成额外的条目线。因此,当我使用 Java 8 或更高版本编译相同的代码时,我得到

stack=3, locals=2, args_size=1
   0: new           #2                  // class java/lang/StringBuilder
   3: dup
   4: invokespecial #3                  // Method java/lang/StringBuilder."<init>":()V
   7: bipush        97
   9: invokevirtual #4                  // Method java/lang/StringBuilder.append:(C)Ljava/lang/StringBuilder;
  12: iconst_5
  13: ldc           #5                  // String
  15: invokevirtual #6                  // Method java/lang/String.length:()I
  18: iadd
  19: invokevirtual #7                  // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder;
  22: invokevirtual #8                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
  25: astore_1
  26: return
LineNumberTable:
  line 7: 0
  line 8: 9
  line 12: 15
  line 9: 19
  line 13: 22
  line 14: 26

注意每个附加条目(与 Java 7 版本相比)如何指向调用指令,以确保方法调用与正确的行号相关联。这极大地改进了异常堆栈跟踪以及步骤调试。

没有显式条目的非调用指令仍将与其最接近的具有条目的前面代码位置相关联。

因此,对应于 'a' 常量的 bipush 97 指令与第 7 行相关联,因为只有后续使用该常量的 append 调用有一个显式条目将其与第 8 行相关联.

下一个表达式 5 + "".length() 的结果更加戏剧化。

使用常量 iconst_5ldc [""] 的指令关联到第 8 行,即前一个 append 调用的位置,而 iadd 指令,实际上属于 5"" 常量之间的 + 运算符,与第 12 行关联,因为获得显式行号的最近调用指令是 length()调用。

为了比较,这是 Eclipse 编译相同代码的方式:

stack=3, locals=2, args_size=1
   0: new           #20                 // class java/lang/StringBuilder
   3: dup
   4: invokespecial #22                 // Method java/lang/StringBuilder."<init>":()V
   7: bipush        97
   9: invokevirtual #23                 // Method java/lang/StringBuilder.append:(C)Ljava/lang/StringBuilder;
  12: iconst_5
  13: ldc           #27                 // String
  15: invokevirtual #29                 // Method java/lang/String.length:()I
  18: iadd
  19: invokevirtual #35                 // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder;
  22: invokevirtual #38                 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
  25: astore_1
  26: return
LineNumberTable:
  line 6: 0
  line 7: 7
  line 9: 12
  line 11: 13
  line 9: 18
  line 8: 19
  line 12: 22
  line 6: 25
  line 13: 26

Eclipse 编译器没有 javac 的历史记录,而是设计为首先为表达式生成行号条目。我们可以看到它将属于调用 expression(不是调用指令)的第一条指令与正确的行相关联,即 bipush 97 for append('a')ldc [""] 对于 "".length().

此外,它还有 iconst_5iaddastore_1 的附加条目,以便将它们与正确的行相关联。当然,这种更高的精度也会导致 class 文件略大。