无缝知道包含空字符的字符串的大小

Seamlessly know the size of a string containing a null char

一个非常简单的新手问题的长问题,但我需要一些建议。

背景

所以我有一个需要解析的二进制文件。该文件以一些包含空字符 ([=14=]) 的神奇字符串开头。让我们定义为 ab[=15=]cd.

我正在编写一个方法,如果某些文件以魔术字符串开头,returns 为真。

尝试 1

#define MAGIC_STRING "ab[=10=]cd"

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < 5)
        return false;

    string strPrefix = strData.substr(0, 5);

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题 1

上面的代码困扰我的是我"hardcodedly"假设魔法字符串的大小是5

万一明天魔法弦变了怎么办?说:

#define MAGIC_STRING "abe[=11=]fcd"

字符串宏已更改,代码不再正常工作。

尝试 2

#define MAGIC_STRING "ab[=12=]cd"

bool IsMagicFile(const wpath& pathFile)
{
    string strMagic = MAGIC_STRING;

    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < strMagic.size())
        return false;

    string strPrefix = strData.substr(0, strMagic.size());

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题 2

我应该摆脱了硬编码的大小问题,但 strMagic 的大小实际上不是 5,而是 2。字符串以 [=14=]

结尾

尝试 3

#define MAGIC_STRING        "ab[=13=]cd"    // CAUTION - MAGIC_STRING & MAGIC_STRING_SIZE must be changes together 
#define MAGIC_STRING_SIZE   5           // CAUTION - MAGIC_STRING & MAGIC_STRING_SIZE must be changes together

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < MAGIC_STRING_SIZE)
        return false;

    string strPrefix = strData.substr(0, MAGIC_STRING_SIZE);

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题 3

这解决了第一个问题,但我仍然没有得到我想要的无缝魔术字符串更改。

问题

尝试 3 是否足够好?你有更好的方法吗?

如果您确实知道您的魔法字符串将包含 [=10=],那么您可以编写自己的 size(string str) 函数,通过在首先 [=10=].

如果不知道魔术字符串中有多少 [=10=],我建议您尝试 3。

如果您需要一些代码来指导您朝着 size 方法的正确方向发展,请告诉我。

您可以定义常量字符数组,而不是使用宏定义。例如

const char MAGIC_STRING[] = "abe[=10=]fcd";

在这种情况下,不包括终止零的字符数等于

sizeof( MAGIC_STRING ) - 1

要比较原始字节,您可以使用标准 C 函数 memcmp 提供等于上述表达式的比较字节数。

这是一个演示程序

#include <iostream>
#include <string>
#include <cstring>
#include <iterator>

const char MAGIC_STRING[] = "abe[=12=]fcd";

int main() 
{
    std::string s( std::begin( MAGIC_STRING ), std::prev( std::end( MAGIC_STRING ) )  );

    if ( memcmp( s.c_str(), MAGIC_STRING, sizeof( MAGIC_STRING ) - 1 ) == 0 )
    {
        std::cout << "The string starts with the MAGIC_STRING" << std::endl;
    }

    return 0;
}

它的输出是

The string starts with the MAGIC_STRING

我个人会避免使用 MACROS。此外,我不会使用为空终止字符串设计的函数,例如标准 <algorithm> 库中的 std::strcmp. You could check if the beginning of a string contains a particular character sequence using std::equal

// create a character array to preserve compile time size
// but remember string literals add a null-terminator extra character
const char magic_string[] = "ab[=10=]cd";

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    // -1 to avoid null terminator from magic_string character array
    return std::equal(magic_string, magic_string + sizeof(magic_string) - 1,
        strData.begin());
}