访问 float 的 4 个字节是否会破坏 C++ 别名规则

Question

我需要读取文件的二进制内容并将提取的字节转换为单精度浮点数。已经有人问过如何做到这一点 here。这个问题确实有正确的答案，但我想知道某个特定答案是否实际上是有效的 C++ 代码。

That answer 给出以下代码：

float bytesToFloat(uint8_t *bytes, bool big_endian) {
    float f;
    uint8_t *f_ptr = (uint8_t *) &f;
    if (big_endian) {
        f_ptr[3] = bytes[0];
        f_ptr[2] = bytes[1];
        f_ptr[1] = bytes[2];
        f_ptr[0] = bytes[3];
    } else {
        f_ptr[3] = bytes[3];
        f_ptr[2] = bytes[2];
        f_ptr[1] = bytes[1];
        f_ptr[0] = bytes[0];
    }
    return f;
}

这实际上是有效的 C++ 代码吗？我不确定它是否违反任何别名规则。

请注意，我针对的是具有大端字节序的平台，其中保证浮点数至少为 32 位长。

Answer 1

Is this actually valid C++ code?

可能是的。它有一些 pre-conditions:

std::uint8_t 必须是 unsigned char
sizeof(float) 必须是 4
bytes + 3 不得溢出缓冲区。

如果前两个不成立，您可以添加检查以确保编译安全失败：

static_assert(std::is_same_v<unsigned char, std::uint8_t>);
static_assert(sizeof(float) == 4);

I'm not sure whether it violates any aliasing rules.

unsigned char不受此类限制。 std::uint8_t，如果已定义，实际上是 unsigned char 的别名，在这种情况下，显示的程序已明确定义。从技术上讲，规则并不能保证这一点，但上述检查将处理不适用的理论情况。

float is guaranteed to be at least 32 bits long.

代码的长度必须正好是 32 位。它还必须具有与 float 被序列化的系统上完全相同的 bit-level 格式。如果它的两端都是标准的 IEE-754 单精度，那么你很好；否则所有赌注均无效。

访问 float 的 4 个字节是否会破坏 C++ 别名规则

Does accessing the 4 bytes of a float break C++ aliasing rules

c++

floating-point

endianness

language-lawyer

single-precision