是否可以在一条指令中将 4 uint8_t 复制到 4 int16?

Is it possible to copy 4 uint8_t into 4 int16 in one instruction?

我想知道是否可以尽快将存储在一个 uint32_t 中的四个 uint8_t 值复制到 uint64_t 中的适当位置。我正在寻找相当于:

union
{
  struct {uint8_t a; uint8_t b; uint8_t c; uint8_t d};
  uint32_t whole;
} x32;

 union
{
  struct {int16_t a; int16_t b; int16_t c; int16_t d};
  uint64_t whole;
} x64;

x64.a=x32.a;
x64.b=x32.b;
x64.c=x32.c;
x64.d=x32.d;

问题是:我无法使用 MMX/SSE。

不,这是不可能的,因为硬件几乎不会提供这种(非常具体的)汇编指令。

C++ 标准不支持通过联合进行类型双关。相反,使用 ors 和 shifts 将值组合在一起。正确性比快速但损坏的代码更重要。

uint8_t a,b,c,d;
uint64_t whole;

whole = a | (uint64_t (b) << 1*16) | (uint64_t (c) << 2*16) | (uint64_t (d) << 3*16)

没有。没有其他方法可以像您正在做的那样移动数据并对其进行零扩展