AnyCPU 与 x64 平台在 64 位机器上的性能差异

Performance difference between AnyCPU vs x64 platform on a 64 bit machine

根据 this QA,在 64 位机器上 运行 使用 Any CPU 和 x64 构建的应用程序之间应该没有性能差异,但是我看到了大约两倍当我专门为 x64 平台构建时,我的用例性能有所提高。

我的用例是操作 64 位 bitboards,大部分处理是对 ulong 变量的位操作和算术。

举个例子:

public static ulong ReverseBits(ulong x)
{
    ulong t;
    x = (x << 32) | (x >> 32); // Swap register halves.
    x = (x & 0x0001FFFF0001FFFFUL) << 15 | // Rotate left
        (x & 0xFFFE0000FFFE0000UL) >> 17; // 15.
    t = (x ^ (x >> 10)) & 0x003F801F003F801FUL;
    x = (t | (t << 10)) ^ x;
    t = (x ^ (x >> 4)) & 0x0E0384210E038421UL;
    x = (t | (t << 4)) ^ x;
    t = (x ^ (x >> 2)) & 0x2248884222488842UL;
    x = (t | (t << 2)) ^ x;
    return x;
}

static void Main(string[] args)
{
    ulong sum = 0;
    var s = Stopwatch.StartNew();
    for (ulong i = 0; i < 1000000000; i++)
    {
        sum += ReverseBits(i);
    }
    s.Stop();

    Console.WriteLine("Sum = {0}, took {1}ms", sum, s.ElapsedMilliseconds);
    Console.ReadLine();
}

在任何 CPU 平台的发布版本中,结果是: Sum = 9745675244420464640, took 13148ms

在使用 x64 平台的发布版本中,结果是:Sum = 9745675244420464640, took 5693ms

这是性能提升的两倍多。如果常见的假设是 Any CPU 与 x64 构建应该在 64 位机器上执行相同,为什么会有如此大的差异?

不,您比较了 32 位和 64 位代码的性能。 x64 风格要快得多,因为它可以使用单个 64 位处理器寄存器进行数学计算。它更像是 32 位机器代码中的一个 slog,它必须兼顾两个 32 位寄存器。使用 Debug > Windows > Disassembly.

很容易看出两者之间的区别

由于您过于关注解决方案平台名称,所以出错了。显示得太突出,但选择只对 C++ 项目重要。不幸的是,由于 .NET Native,在 UWP 项目上。它选择构建工具风格,C# 只有一个编译器可以针对任何平台。

重要的 real 设置是抖动强制选项。项目 > 属性 > 构建选项卡。 Select 发布版本(如有必要)并选择平台目标和 "Prefer 32-bit" 设置。取消勾选后者。您现在将在 64 位操作系统上看到 AnyCPU == x64。