istream_iterator 遍历二进制文件中的字节

istream_iterator to iterate through bytes in a binary file

给定一个包含以下十六进制代码的文件:0B 00 00 00 00 00 20 41

我正在尝试填充 std::vector ,然后手动检查每个字节。

这是我使用迭代器构造函数

从两个 std::istream_iterators 创建向量的代码
using Bytes   = std::vector<std::uint8_t>;
using ByteItr = std::istream_iterator<std::uint8_t>;

Bytes getBytes()
{
    std::ifstream in;
    in.open("filepath");
    in.seekg(0, std::ios::beg);
    Bytes bytes;
    ByteItr start(in);
    ByteItr end;
    return Bytes(start, end);
}

这是我要通过的单元测试:

auto bytes = getBytes();

REQUIRE( bytes.size() == 8 );

CHECK( bytes[0] == 0x0B );
CHECK( bytes[1] == 0x00 );
CHECK( bytes[2] == 0x00 );
CHECK( bytes[3] == 0x00 );
CHECK( bytes[4] == 0x00 );
CHECK( bytes[5] == 0x00 );
CHECK( bytes[6] == 0x20 );
CHECK( bytes[7] == 0x41 );

为什么在这种情况下,它会跳过两个元素并将我的 std::uint8_t 向量隐式转换为无符号字符?

不要使用 std::istream_iterator<T>:这是用于文本格式输入的。例如,它很可能会跳过空格(您可以使用 std::noskipws 禁用跳过空格,但这仍然是错误的做法 - 使用 std::istreambuf_iterator<char> 代替;类型 char 是字符流的类型)。

此外,在处理二进制数据时,请确保您的流以二进制模式打开以避免行尾转换(以防您在进行行尾​​转换的平台上尝试这样做)。也就是说,您需要将 std::ios_base::binary 添加到打开模式。

istream_iterator 不应该用于读取二进制文件。它使用 operator>>,这也不适合读取二进制文件(除非这些文件是大多数二进制文件不适合的非常特殊的格式)。您可以改用 istreambuf_iterator。您还希望确保以二进制模式打开文件。

in.open("filepath", std::ios::in | std::ios::binary);