CLR 中 castclass 操作码的用途是什么?

What's the purpose of castclass opcode in CLR?

我遇到了定义在 Standard ECMA - 335, III.4.3castclass 操作码。我写了几个使用 callvirt 操作码的例子,有转换和没有转换。事实证明,castclass 操作码对性能有很大影响。

为了测试,我使用了以下“粗略”(就方法执行时间的不精确而言)程序(由 msvc 2015Release mode 中编译):

public class Program
{
    public interface IShow {  string show(); }
    public class ObjectWithShow : IShow 
    { 
        public string show() => "Hello, that's the show method."; 
    }
    // Such functions remains unchanged
    public static string showWithCast(object o) => ((IShow)o).show();
    public static string show(IShow o) => o.show();
    // Such function will be patched later
    public static string showWithoutCast(object o) => ((IShow)o).show();

    public static void Main()
    {
        int N = 10000000;
        var show_object = new ObjectWithShow();
        {

           var watch = System.Diagnostics.Stopwatch.StartNew();
            for (int i = 0; i < N; ++i)
            {
                showWithCast(show_object);
            }
            watch.Stop();
            Console.WriteLine($"With cast {watch.ElapsedMilliseconds}");
        }
        {

            var watch = System.Diagnostics.Stopwatch.StartNew();
            for (int i = 0; i < N; ++i)
            {
                showWithoutCast(show_object);
            }
            watch.Stop();
            Console.WriteLine($"Without cast {watch.ElapsedMilliseconds}");
        }
        {

            var watch = System.Diagnostics.Stopwatch.StartNew();
            for (int i = 0; i < N; ++i)
            {
                show(show_object);
            }
            watch.Stop();
            Console.WriteLine($"Without cast {watch.ElapsedMilliseconds}");
        }
    }
}

这里是 show/showWitCast 函数的 IL 代码:

.method public hidebysig static string show (class IShow o) cil managed 
{
    .maxstack 8
    IL_0000: ldarg.0
    IL_0001: callvirt instance string IShow::show()
    IL_0006: ret
} // end of method Program::show


.method public hidebysig static string showWithCast (object o) cil managed 
{
    .maxstack 8
    IL_0000: ldarg.0
    IL_0001: castclass IShow
    IL_0006: callvirt instance string IShow::show()
    IL_000b: ret
} // end of method Program::showWithCast

这是 showWithoutCast 的代码(注意:我通过在 IL 编辑器中删除 castclass IShow 来修补它。原始版本与 showWithCast 相同)

.method public hidebysig static string showWithoutCast (object o) cil managed 
{

    .maxstack 8

    IL_0000: ldarg.0
    IL_0001: callvirt instance string IShow::show()
    IL_0006: ret
} // end of method Program::showWithoutCast

执行结果(i7-3370 CPU@3.40GHz, 8GB RAM)显示如下结果:

With cast 46

Without cast 24

Without cast 23

事实证明,在没有 castclass 的对象上 callvirt 显示的结果几乎与我们使用接口实例的结果相同。那么,castclass 的目的是什么?我猜想 c# compiler 发出这样的代码是为了确保 callvirt 操作码不会用于不正确的类型(因为它无法在编译时执行此类检查)。所以,下面的问题 - 它是否一致 CIL 代码,我故意在某些地方删除 castclass 的使用,我保证该方法将仅用于实现 IShow 的类型?

P.S。当然,你可以问,是不是应该用show方法呢?但有些情况下,无法使用此类功能。简而言之,我动态生成代码,我想实现泛型容器(它继承IShow),但是它的泛型参数可以选择性地实现接口IShow。如果泛型参数没有实现接口(比如是int)那么我保证不会使用容器的show方法

所有 callvirt instance string IShow::show 指令都调用相同的存根,它跳转到与接口方法关联的 lookup stub。查找存根将根据接收调用的对象的类型解析要调用的方法。在本例中,该对象确实实现了 IShow,因此如您所见,一切正常。但是,如果您传递一个未实现 IShow 的对象,查找存根将不会在该对象的方法 table 中找到 IShow::show,因此会抛出类型 EntryPointNotFoundException 的异常.

在执行 callvirt 指令时,IL 虚拟机的评估堆栈包含一个 object 类型的对象。目标方法是 IShow::show()。根据 CLI 规范第 III.4.2 节,类型 object 需要可验证者分配给 IShow 才能使 IL 代码可验证。 castclass 使代码可验证。在这种情况下,由于代码是完全可信的,验证会自动跳过,因此不会抛出验证异常,方法会得到 JIT 编译和执行。

从技术上讲,在这种情况下,showWithoutCast 不包含任何 IL 指令,这些指令应根据规范引发 EntryPointNotFoundException 类型的异常。但是,由于代码不可验证,标准的第 II.3 节指出,在验证失败的情况下,行为是 unspecified。也就是说,实现不需要记录发生的行为。另一方面,可验证代码的行为是指定并且castclass使验证成功。

请注意,当您在计算机上本地构建 IL 代码并 运行 它时,它会自动被视为完全可信。所以 JIT 编译器不会验证任何方法。