CLR System.NullReferenceException 强制 'Set Next Statement' 进入 'if' 块

CLR System.NullReferenceException when forcing 'Set Next Statement' into 'if' block

背景

我接受这不是正常代码执行期间可能发生的事情,但我在调试时发现了它,并认为它很有趣,可以分享。

我认为这是由 JIT 编译器引起的,但欢迎任何进一步的想法。

我已经使用 VS2013 复制了这个针对 4.5 和 4.5.1 框架的问题:


设置

要查看此异常,必须启用 Common Language Runtime ExceptionsDEBUG > Exceptions...

我已将问题的原因提炼为以下示例:

using System.Collections.Generic;
using System.Linq;

namespace ConsoleApplication6
{
    public class Program
    {
        static void Main()
        {
            var myEnum = MyEnum.Good;

            var list = new List<MyData>
            {
                new MyData{ Id = 1, Code = "1"},
                new MyData{ Id = 2, Code = "2"},
                new MyData{ Id = 3, Code = "3"}
            };

            // Evaluates to false
            if (myEnum == MyEnum.Bad) // BREAK POINT 
            {
                /*
                 * A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe

                   Additional information: Object reference not set to an instance of an object.
                 */
                var x = new MyClass();

                MyData result;
                //// With this line the 'System.NullReferenceException' gets thrown in the line above:
                result = list.FirstOrDefault(r => r.Code == x.Code);

                //// But with this line, with 'x' not referenced, the code above runs ok:
                //result = list.FirstOrDefault(r => r.Code == "x.Code");
            }
        }
    }

    public enum MyEnum
    {
        Good,
        Bad
    }

    public class MyClass
    {
        public string Code { get; set; }
    }

    public class MyData
    {
        public int Id { get; set; }
        public string Code { get; set; }
    }
}

复制

if (myEnum == MyEnum.Bad) 和 运行 代码上放置一个断点。 当命中断点时,Set Next Statement(Ctrl+Shift+F10)到是 if 语句和 运行 的左大括号,直到:

接下来,注释 out 第一个 lamda 语句并注释 in 第二个 - 所以 MyClass 实例不是用过的。 重新运行 过程(中断,强制进入if 语句和运行ning)。您会看到代码正常工作:

最后,注释 in 第一个 lamda 语句并注释 out 第二个 - 所以 MyClass 实例 使用。然后将if语句的内容重构为一个新的方法:

using System.Collections.Generic;
using System.Linq;

namespace ConsoleApplication6
{
    public class Program
    {
        static void Main()
        {
            var myEnum = MyEnum.Good;

            var list = new List<MyData>
            {
                new MyData{ Id = 1, Code = "1"},
                new MyData{ Id = 2, Code = "2"},
                new MyData{ Id = 3, Code = "3"}
            };

            // Evaluates to false
            if (myEnum == MyEnum.Bad) // BREAK POINT 
            {
                MyMethod(list);
            }
        }

        private static void MyMethod(List<MyData> list)
        {
            // When the code is in this method, it works fine
            var x = new MyClass();

            MyData result;

            result = list.FirstOrDefault(r => r.Code == x.Code);
        }
    }

    public enum MyEnum
    {
        Good,
        Bad
    }

    public class MyClass
    {
        public string Code { get; set; }
    }

    public class MyData
    {
        public int Id { get; set; }
        public string Code { get; set; }
    }
}

重新运行 测试,一切正常:


结论?

我的假设是 JIT 编译器已将 lamda 优化为始终为 null,并且一些进一步优化的代码是 运行ning 在实例初始化之前。

正如我之前提到的,这在生产代码中永远不会发生,但我很想知道发生了什么。

这是一个不可避免的事故,与优化无关。通过使用 Set Next Statement 命令,您将绕过 的代码,这比您从源代码中很容易看到的要多。只有当您查看生成的机器代码时,它才会变得显而易见。在断点处使用Debug + Windows + Disassembly。你会看到:

            // Evaluates to false
            if (myEnum == MyEnum.Bad) // BREAK POINT 
0000016c  cmp         dword ptr [ebp-3Ch],1 
00000170  setne       al 
00000173  movzx       eax,al 
00000176  mov         dword ptr [ebp-5Ch],eax 
00000179  cmp         dword ptr [ebp-5Ch],0 
0000017d  jne         00000209 
00000183  mov         ecx,2B02C6Ch               // <== You are bypassing this
00000188  call        FFD6FAE0 
0000018d  mov         dword ptr [ebp-7Ch],eax 
00000190  mov         ecx,dword ptr [ebp-7Ch] 
00000193  call        FFF0A190 
00000198  mov         eax,dword ptr [ebp-7Ch] 
0000019b  mov         dword ptr [ebp-48h],eax 
            {
0000019e  nop 
                /*
                 * A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe

                   Additional information: Object reference not set to an instance of an object.
                 */
                var x = new MyClass();
0000019f  mov         ecx,2B02D04h             // And skipped to this
000001a4  call        FFD6FAE0 
// etc...

那么,那个神秘代码是什么?这不是您在程序中明确编写的任何内容。您可以使用反汇编 window 中的 Set Next Statement 命令找出答案。将其移动到地址 00000183,即 if() 语句之后的第一个可执行代码。开始步进,你会看到它执行了一个名为 ConsoleApplication1.Program.<>c__DisplayClass5

的 class 的构造函数

否则在现有 SO 问题中会很好地涵盖,这是为源代码中的 lambda 表达式自动生成的 class。需要在程序中存储捕获的变量 list。由于您跳过了它的创建,因此在 lambda 中取消引用 list 总是会导致 NRE 爆炸。

"leaky abstraction" 的标准情况,C# 有一些,但并不离谱。当然,您对此无能为力,您当然可以责怪调试器没有正确猜测,但这是一个很难解决的问题。它无法轻易找出该代码是否属于 if() 语句或它后面的代码。一个设计问题,调试信息是基于行号的,没有代码行。通常也是 x64 抖动的问题,即使在简单的情况下它也会出错。应该在 VS2015 中修复。

这是您必须通过 Hard Way™ 学习的东西。如果它真的非常重要,那么我向您展示了如何正确设置下一条语句,您必须在反汇编视图中进行设置才能使其正常工作。请随时在 connect.microsoft.com 报告此问题,但如果他们还不知道,我会感到惊讶。