CLR System.NullReferenceException 强制 'Set Next Statement' 进入 'if' 块
CLR System.NullReferenceException when forcing 'Set Next Statement' into 'if' block
背景
我接受这不是正常代码执行期间可能发生的事情,但我在调试时发现了它,并认为它很有趣,可以分享。
我认为这是由 JIT 编译器引起的,但欢迎任何进一步的想法。
我已经使用 VS2013 复制了这个针对 4.5 和 4.5.1 框架的问题:
设置
要查看此异常,必须启用 Common Language Runtime Exceptions
:
DEBUG
> Exceptions...
我已将问题的原因提炼为以下示例:
using System.Collections.Generic;
using System.Linq;
namespace ConsoleApplication6
{
public class Program
{
static void Main()
{
var myEnum = MyEnum.Good;
var list = new List<MyData>
{
new MyData{ Id = 1, Code = "1"},
new MyData{ Id = 2, Code = "2"},
new MyData{ Id = 3, Code = "3"}
};
// Evaluates to false
if (myEnum == MyEnum.Bad) // BREAK POINT
{
/*
* A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe
Additional information: Object reference not set to an instance of an object.
*/
var x = new MyClass();
MyData result;
//// With this line the 'System.NullReferenceException' gets thrown in the line above:
result = list.FirstOrDefault(r => r.Code == x.Code);
//// But with this line, with 'x' not referenced, the code above runs ok:
//result = list.FirstOrDefault(r => r.Code == "x.Code");
}
}
}
public enum MyEnum
{
Good,
Bad
}
public class MyClass
{
public string Code { get; set; }
}
public class MyData
{
public int Id { get; set; }
public string Code { get; set; }
}
}
复制
在 if (myEnum == MyEnum.Bad)
和 运行 代码上放置一个断点。
当命中断点时,Set Next Statement
(Ctrl+Shift+F10)到是 if
语句和 运行 的左大括号,直到:
接下来,注释 out 第一个 lamda 语句并注释 in 第二个 - 所以 MyClass
实例不是用过的。
重新运行 过程(中断,强制进入if
语句和运行ning)。您会看到代码正常工作:
最后,注释 in 第一个 lamda 语句并注释 out 第二个 - 所以 MyClass
实例 是使用。然后将if
语句的内容重构为一个新的方法:
using System.Collections.Generic;
using System.Linq;
namespace ConsoleApplication6
{
public class Program
{
static void Main()
{
var myEnum = MyEnum.Good;
var list = new List<MyData>
{
new MyData{ Id = 1, Code = "1"},
new MyData{ Id = 2, Code = "2"},
new MyData{ Id = 3, Code = "3"}
};
// Evaluates to false
if (myEnum == MyEnum.Bad) // BREAK POINT
{
MyMethod(list);
}
}
private static void MyMethod(List<MyData> list)
{
// When the code is in this method, it works fine
var x = new MyClass();
MyData result;
result = list.FirstOrDefault(r => r.Code == x.Code);
}
}
public enum MyEnum
{
Good,
Bad
}
public class MyClass
{
public string Code { get; set; }
}
public class MyData
{
public int Id { get; set; }
public string Code { get; set; }
}
}
重新运行 测试,一切正常:
结论?
我的假设是 JIT 编译器已将 lamda 优化为始终为 null,并且一些进一步优化的代码是 运行ning 在实例初始化之前。
正如我之前提到的,这在生产代码中永远不会发生,但我很想知道发生了什么。
这是一个不可避免的事故,与优化无关。通过使用 Set Next Statement 命令,您将绕过 多 的代码,这比您从源代码中很容易看到的要多。只有当您查看生成的机器代码时,它才会变得显而易见。在断点处使用Debug + Windows + Disassembly。你会看到:
// Evaluates to false
if (myEnum == MyEnum.Bad) // BREAK POINT
0000016c cmp dword ptr [ebp-3Ch],1
00000170 setne al
00000173 movzx eax,al
00000176 mov dword ptr [ebp-5Ch],eax
00000179 cmp dword ptr [ebp-5Ch],0
0000017d jne 00000209
00000183 mov ecx,2B02C6Ch // <== You are bypassing this
00000188 call FFD6FAE0
0000018d mov dword ptr [ebp-7Ch],eax
00000190 mov ecx,dword ptr [ebp-7Ch]
00000193 call FFF0A190
00000198 mov eax,dword ptr [ebp-7Ch]
0000019b mov dword ptr [ebp-48h],eax
{
0000019e nop
/*
* A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe
Additional information: Object reference not set to an instance of an object.
*/
var x = new MyClass();
0000019f mov ecx,2B02D04h // And skipped to this
000001a4 call FFD6FAE0
// etc...
那么,那个神秘代码是什么?这不是您在程序中明确编写的任何内容。您可以使用反汇编 window 中的 Set Next Statement 命令找出答案。将其移动到地址 00000183
,即 if() 语句之后的第一个可执行代码。开始步进,你会看到它执行了一个名为 ConsoleApplication1.Program.<>c__DisplayClass5
的 class 的构造函数
否则在现有 SO 问题中会很好地涵盖,这是为源代码中的 lambda 表达式自动生成的 class。需要在程序中存储捕获的变量 list
。由于您跳过了它的创建,因此在 lambda 中取消引用 list
总是会导致 NRE 爆炸。
"leaky abstraction" 的标准情况,C# 有一些,但并不离谱。当然,您对此无能为力,您当然可以责怪调试器没有正确猜测,但这是一个很难解决的问题。它无法轻易找出该代码是否属于 if() 语句或它后面的代码。一个设计问题,调试信息是基于行号的,没有代码行。通常也是 x64 抖动的问题,即使在简单的情况下它也会出错。应该在 VS2015 中修复。
这是您必须通过 Hard Way™ 学习的东西。如果它真的非常重要,那么我向您展示了如何正确设置下一条语句,您必须在反汇编视图中进行设置才能使其正常工作。请随时在 connect.microsoft.com 报告此问题,但如果他们还不知道,我会感到惊讶。
背景
我接受这不是正常代码执行期间可能发生的事情,但我在调试时发现了它,并认为它很有趣,可以分享。
我认为这是由 JIT 编译器引起的,但欢迎任何进一步的想法。
我已经使用 VS2013 复制了这个针对 4.5 和 4.5.1 框架的问题:
设置
要查看此异常,必须启用 Common Language Runtime Exceptions
:
DEBUG
> Exceptions...
我已将问题的原因提炼为以下示例:
using System.Collections.Generic;
using System.Linq;
namespace ConsoleApplication6
{
public class Program
{
static void Main()
{
var myEnum = MyEnum.Good;
var list = new List<MyData>
{
new MyData{ Id = 1, Code = "1"},
new MyData{ Id = 2, Code = "2"},
new MyData{ Id = 3, Code = "3"}
};
// Evaluates to false
if (myEnum == MyEnum.Bad) // BREAK POINT
{
/*
* A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe
Additional information: Object reference not set to an instance of an object.
*/
var x = new MyClass();
MyData result;
//// With this line the 'System.NullReferenceException' gets thrown in the line above:
result = list.FirstOrDefault(r => r.Code == x.Code);
//// But with this line, with 'x' not referenced, the code above runs ok:
//result = list.FirstOrDefault(r => r.Code == "x.Code");
}
}
}
public enum MyEnum
{
Good,
Bad
}
public class MyClass
{
public string Code { get; set; }
}
public class MyData
{
public int Id { get; set; }
public string Code { get; set; }
}
}
复制
在 if (myEnum == MyEnum.Bad)
和 运行 代码上放置一个断点。
当命中断点时,Set Next Statement
(Ctrl+Shift+F10)到是 if
语句和 运行 的左大括号,直到:
接下来,注释 out 第一个 lamda 语句并注释 in 第二个 - 所以 MyClass
实例不是用过的。
重新运行 过程(中断,强制进入if
语句和运行ning)。您会看到代码正常工作:
最后,注释 in 第一个 lamda 语句并注释 out 第二个 - 所以 MyClass
实例 是使用。然后将if
语句的内容重构为一个新的方法:
using System.Collections.Generic;
using System.Linq;
namespace ConsoleApplication6
{
public class Program
{
static void Main()
{
var myEnum = MyEnum.Good;
var list = new List<MyData>
{
new MyData{ Id = 1, Code = "1"},
new MyData{ Id = 2, Code = "2"},
new MyData{ Id = 3, Code = "3"}
};
// Evaluates to false
if (myEnum == MyEnum.Bad) // BREAK POINT
{
MyMethod(list);
}
}
private static void MyMethod(List<MyData> list)
{
// When the code is in this method, it works fine
var x = new MyClass();
MyData result;
result = list.FirstOrDefault(r => r.Code == x.Code);
}
}
public enum MyEnum
{
Good,
Bad
}
public class MyClass
{
public string Code { get; set; }
}
public class MyData
{
public int Id { get; set; }
public string Code { get; set; }
}
}
重新运行 测试,一切正常:
结论?
我的假设是 JIT 编译器已将 lamda 优化为始终为 null,并且一些进一步优化的代码是 运行ning 在实例初始化之前。
正如我之前提到的,这在生产代码中永远不会发生,但我很想知道发生了什么。
这是一个不可避免的事故,与优化无关。通过使用 Set Next Statement 命令,您将绕过 多 的代码,这比您从源代码中很容易看到的要多。只有当您查看生成的机器代码时,它才会变得显而易见。在断点处使用Debug + Windows + Disassembly。你会看到:
// Evaluates to false
if (myEnum == MyEnum.Bad) // BREAK POINT
0000016c cmp dword ptr [ebp-3Ch],1
00000170 setne al
00000173 movzx eax,al
00000176 mov dword ptr [ebp-5Ch],eax
00000179 cmp dword ptr [ebp-5Ch],0
0000017d jne 00000209
00000183 mov ecx,2B02C6Ch // <== You are bypassing this
00000188 call FFD6FAE0
0000018d mov dword ptr [ebp-7Ch],eax
00000190 mov ecx,dword ptr [ebp-7Ch]
00000193 call FFF0A190
00000198 mov eax,dword ptr [ebp-7Ch]
0000019b mov dword ptr [ebp-48h],eax
{
0000019e nop
/*
* A first chance exception of type 'System.NullReferenceException' occurred in ConsoleApplication6.exe
Additional information: Object reference not set to an instance of an object.
*/
var x = new MyClass();
0000019f mov ecx,2B02D04h // And skipped to this
000001a4 call FFD6FAE0
// etc...
那么,那个神秘代码是什么?这不是您在程序中明确编写的任何内容。您可以使用反汇编 window 中的 Set Next Statement 命令找出答案。将其移动到地址 00000183
,即 if() 语句之后的第一个可执行代码。开始步进,你会看到它执行了一个名为 ConsoleApplication1.Program.<>c__DisplayClass5
否则在现有 SO 问题中会很好地涵盖,这是为源代码中的 lambda 表达式自动生成的 class。需要在程序中存储捕获的变量 list
。由于您跳过了它的创建,因此在 lambda 中取消引用 list
总是会导致 NRE 爆炸。
"leaky abstraction" 的标准情况,C# 有一些,但并不离谱。当然,您对此无能为力,您当然可以责怪调试器没有正确猜测,但这是一个很难解决的问题。它无法轻易找出该代码是否属于 if() 语句或它后面的代码。一个设计问题,调试信息是基于行号的,没有代码行。通常也是 x64 抖动的问题,即使在简单的情况下它也会出错。应该在 VS2015 中修复。
这是您必须通过 Hard Way™ 学习的东西。如果它真的非常重要,那么我向您展示了如何正确设置下一条语句,您必须在反汇编视图中进行设置才能使其正常工作。请随时在 connect.microsoft.com 报告此问题,但如果他们还不知道,我会感到惊讶。