将 C++ std::string 转换为 UTF-16-LE 编码的字符串

Convert C++ std::string to UTF-16-LE encoded string

我今天搜索了几个小时,就是找不到适合我的东西。我刚刚看过的那个没有运气,是“How to convert UTF-8 encoded std::string to UTF-16 std::string”。

我的问题是,简单解释一下:

我想在标准 C++ 中制作一个有效的 NTLM 散列,并且我正在使用 OpenSSL 的库使用其 MD4 例程创建散列。我知道该怎么做,所以有人知道如何将 std::string 转换为 UTF-16 LE 编码字符串,我可以将其传递给 MD4 函数以获得正确的摘要吗?

那么,我可以有一个 std::string 保存 char 类型,并将其转换为 UTF16-LE 编码的可变长度 std::string_type 吗?是 std::u16string 还是 std::wstring?

我会使用 s.c_str() 还是 s.data() 并且 length() 函数在这两种情况下都能正确报告?

抱歉,第一手...这将是一个带有一些长代码的丑陋回复。我最终使用了以下函数,同时有效地将 iconv 逐个文件编译到我的 windows 应用程序文件中 :)

希望对您有所帮助。

char* conver(const char* in, size_t in_len, size_t* used_len)
{
    const int CC_MUL = 2; // 16 bit
    setlocale(LC_ALL, "");
    char* t1 = setlocale(LC_CTYPE, "");
    char* locn = (char*)calloc(strlen(t1) + 1, sizeof(char));
    if(locn == NULL)
    {
        return 0;
    }

    strcpy(locn, t1);
    const char* enc = strchr(locn, '.') + 1;

#if _WINDOWS
    std::string win = "WINDOWS-";
    win += enc;
    enc = win.c_str();
#endif

    iconv_t foo = iconv_open("UTF-16LE", enc);

    if(foo == (void*)-1)
    {
        if (errno == EINVAL)
        {
            fprintf(stderr, "Conversion from %s is not supported\n", enc);
        }
        else
        {
            fprintf(stderr, "Initialization failure:\n");
        }
        free(locn);
        return 0;
    }

    size_t out_len = CC_MUL * in_len;
    size_t saved_in_len = in_len;
    iconv(foo, NULL, NULL, NULL, NULL);
    char* converted = (char*)calloc(out_len, sizeof(char));
    char *converted_start = converted;
    char* t = const_cast<char*>(in);
    int ret = iconv(foo,
                    &t,
                    &in_len,
                    &converted,
                    &out_len);
    iconv_close(foo);
    *used_len = CC_MUL * saved_in_len - out_len;

    if(ret == -1)
    {
        switch(errno)
        {
        case EILSEQ:
            fprintf(stderr,  "EILSEQ\n");
            break;
        case EINVAL:
            fprintf(stderr,  "EINVAL\n");
            break;
        }

        perror("iconv");
        free(locn);
        return 0;
    }
    else
    {
        free(locn);
        return converted_start;
    }
}

我认为像这样的东西应该可以解决问题:

std::string utf16_to_utf8(std::u16string const& s)
{
    std::wstring_convert<std::codecvt_utf8_utf16<char16_t, 0x10ffff,
        std::codecvt_mode::little_endian>, char16_t> cnv;
    std::string utf8 = cnv.to_bytes(s);
    if(cnv.converted() < s.size())
        throw std::runtime_error("incomplete conversion");
    return utf8;
}

std::u16string utf8_to_utf16(std::string const& utf8)
{
    std::wstring_convert<std::codecvt_utf8_utf16<char16_t, 0x10ffff,
        std::codecvt_mode::little_endian>, char16_t> cnv;
    std::u16string s = cnv.from_bytes(utf8);
    if(cnv.converted() < utf8.size())
        throw std::runtime_error("incomplete conversion");
    return s;
}

注意: std::wstring_convert 在 [=11= 中 已弃用 ] 但我仍然喜欢使用它而不是非标准库,因为它是可移植的,没有依赖关系,并且毫无疑问会一直保留到被替换。

而且,如果所有其他方法都失败了,您可以使用替代代码重新实现这些相同的功能,而无需更改应用程序的任何其他部分。