如何使用 java 代理和 ASM 监控对象创建?

How to monitor object creation using java agent and ASM?

我想做的是监控对象创建并记录该对象的唯一 ID。

首先我尝试监视 NEW 指令但它无法工作并抛出 VerifyError: (...) Expecting to find object/array on stack。听说 NEW 之后的对象是未初始化的,所以不能传递给其他方法。所以我放弃了这种做法。

其次,我尝试监听<init>的调用,这个方法初始化未初始化的对象。但是我不确定初始化之后,初始化后的对象是否会被压入栈中?

在我的访问者适配器方法中:

public void visitMethodInsn(int opc, String owner, String name, String desc, boolean isInterface) {
    ...
    mv.visitMethodInsn(opc, owner, name, desc, isInterface);
    if (opc == INVOKESPECIAL && name.equals("<init>")) {
        mv.visitInsn(DUP);
        mv.visitMethodInsn(INVOKESTATIC, "org/myekstazi/agent/PurityRecorder", "object_new",
                "(Ljava/lang/Object;)V", false);
    }
}

MyRecorder.java中:

public static void object_new(Object ref){
    log("object_new !");
    log("MyRecorder: " + ref);
    log("ref.getClass().getName(): " + ref.getClass().getName());
}

我在演示中试过了,它抛出 VerifyError:

Error: A JNI error has occurred, please check your installation and try again
Exception in thread "main" java.lang.VerifyError: Operand stack underflow
Exception Details:
  Location:
    AbstractDemo.<init>()V @4: dup
  Reason:
    Attempt to pop empty stack.
  Current Frame:
    bci: @4
    flags: { }
    locals: { 'AbstractDemo' }
    stack: { }
  Bytecode:
    0x0000000: 2ab7 0001 59b8 003b b1

        at java.lang.Class.getDeclaredMethods0(Native Method)
        at java.lang.Class.privateGetDeclaredMethods(Unknown Source)
        at java.lang.Class.privateGetMethodRecursive(Unknown Source)
        at java.lang.Class.getMethod0(Unknown Source)
        at java.lang.Class.getMethod(Unknown Source)
        at sun.launcher.LauncherHelper.validateMainClass(Unknown Source)
        at sun.launcher.LauncherHelper.checkAndLoadMain(Unknown Source)

好像不太好用。是否有任何替代方法来监视对象创建?

留言部分

Location:
  AbstractDemo.<init>()V @4: dup

提示:您正在检测构造函数。在构造函数中,invokespecial <init> 也用于委托给另一个构造函数,在同一个 class 或在 superclass.

调用另一个构造函数的典型顺序是 aload_0 (this),压入参数,invokespecial <init>,因此在调用之后没有对堆栈上对象的引用。

VerifyError 的解码字节码如下所示:

  0 aload_0
  1 invokespecial   [1]
  4 dup
  5 invokestatic    [59]
  8 return

通常,您不想报告这些委托构造函数调用,因为它们会导致多次报告同一对象。但是识别它们可能很棘手,因为接收者 class 不是一个可靠的标准。例如,以下是有效的 Java 代码:

public class Example {
    Example reference;
    Example(Example anotherObject) {
        reference = anotherObject;
    }
    Example() {
        this(new Example(null));
        reference.reference = new Example(this);
    }
}

在这里,我们有一个包含三个具有相同目标 class 的 invokespecial 指令的构造函数,委托构造函数调用既不是第一个也不是最后一个,因此没有简单到-检查指令本身告诉你的属性。您必须将提供指令的目标标识为索引零的 aload,即 this,以了解指令是否正在初始化当前实例,当中间有提供指令的参数时,这是非常重要的。

也就是说,即使在构造函数之外,也不能保证新实例化的对象在堆栈中。当实例化用于随后存储或使用结果的表达式上下文中而不是语句上下文中时,通常是这种情况。换句话说,对于像

这样的方法
void test() {
    new Example();
}

朴素的编译器实现(如 javac)可能会生成与表达式代码等价的代码,后跟 pop 指令,但其他实现(如 ecj)可能会省略前面的代码dup 在这种情况下,消除了对后续 pop 的需要,因为在 invokespecial <init> 指令之后堆栈上没有引用。

一种更安全的方法是搜索以 new 开始并导致 invokespecial <init> 的指令序列(允许嵌套出现)。然后,在 new 指令之后注入一个 dup ,在 invokespecial.

指令之后注入 invokestatic

由于 Holger 的回答中描述的原因,在实例化站点检测新对象可能非常棘手。为了检测对象分配,代理通常采用另一种方式 - 他们修改 Object() 构造函数,因为所有普通构造函数最终都会通过 super() 构造函数链调用 Object()

但是,这不会捕获所有对象分配。如果您关心数组,您还需要检测 newarrayanewarraymultianewarray 字节码。

此外,本机代码和 JVM 本身可以在不调用构造函数的情况下创建或克隆对象。这个需要用JVM TI单独处理。

有关详细信息,请查看