通过转换在 uint8_t[8] 和 uint64_t 之间安全转换?

Convert safely between uint8_t[8] & uint64_t via cast?

我目前的做法(我更愿意摆脱 memcpy 调用):

uint64_t integer;
uint8_t string[8];
...
memcpy(&integer, &string, 8); //or swap the parameters

假设 integer 数组长度始终是 8 的倍数(64 位总分配) 考虑到编译器填充/对齐问题,是否可以直接转换?

如果您正在努力优化,绝对没有必要避免或替换 memcpy() 调用。每个现代优化编译器都不会发出调用并生成等效的汇编代码。较新的 GCC 和 Clang 版本甚至在未提供优化相关选项时也会这样做。顺便说一句,可以使用 -fno-builtin 禁用该行为。

您可以使用 C++ Compiler Explorer(当然也可以在本地使用 -S)自行验证:

#include <string.h>
#include <stdint.h>

uint64_t
u8tou64(uint8_t const u8[static 8]){
  uint64_t u64;
  memcpy(&u64, u8, sizeof u64);
  return u64;
}

例如,针对 x86_64 的 GCC 4.8.1 生成:

u8tou64:
    push    rbp
    mov rbp, rsp
    mov QWORD PTR [rbp-24], rdi
    mov rax, QWORD PTR [rbp-24]
    mov rax, QWORD PTR [rax]
    mov QWORD PTR [rbp-8], rax
    mov rax, QWORD PTR [rbp-8]
    pop rbp
    ret

-O3:

u8tou64:
    mov rax, QWORD PTR [rdi]
    ret
John Regehr 的

This blog post 得出相同的结论(c5() 调用 memcpy()):

In my opinion c5 is the easiest code to understand out of this little batch of functions because it doesn’t do the messy shifting and also it is totally, completely, obviously free of complications that might arise from the confusing rules for unions and strict aliasing. It became my preferred idiom for type punning a few years ago when I discovered that compilers could see through the memcpy and generate the right code.

使用联合或按位运算等替代方案可能不会产生最佳(和体面的外观)代码,或者不能在 ISO C90 或 C++ 中使用(这也包括 GCC 的 __may_alias__ 属性,在评论区)。