最佳性能加法模 2^32 实现

Question

我正在研究 SHA-256 实现，我已经到了需要对无符号数进行加法模 2^32 的地步。

我的第一个想法是使用溢出行为：

uint32_t a = ...;
uint32_t b = ...;
uint32_t c = a + b;

但我有两个顾虑：

我的第二个想法是使用更长类型的变量来实现它：

uint32_t a = ...;
uint32_t b = ...;
uint64_t a_64 = a;
uint64_t b_64 = b;
uint64_t c_64 = a_64 + b_64;
uint32_t c = uint32_t(c_64 & 0xFFFFFFFF);

但是这个解决方案需要几个额外的变量、它们的初始化和额外的按位与操作。

在 C 编程原则和性能方面，这些实现中的哪一个（如果有）是正确的？如果其中 none 个，正确的实施是什么？

Answer 1

uint32_t 是模 2^32 类型。它不仅是一种范围至少达到 2^32-1 的类型，而且根据硬件要求可能更多；那将是 uint32least_t.

所以，uint32_t上的加法总是模加法，不适合需要溢出概念的运算。最好的解决方案就是 a+b.

Best performance addition modulo 2^32 implemetation