将 C++ std::string 转换为 UTF-16-LE 编码的字符串
Convert C++ std::string to UTF-16-LE encoded string
我今天搜索了几个小时,就是找不到适合我的东西。我刚刚看过的那个没有运气,是“How to convert UTF-8 encoded std::string to UTF-16 std::string”。
我的问题是,简单解释一下:
我想在标准 C++ 中制作一个有效的 NTLM 散列,并且我正在使用 OpenSSL 的库使用其 MD4 例程创建散列。我知道该怎么做,所以有人知道如何将 std::string
转换为 UTF-16 LE 编码字符串,我可以将其传递给 MD4 函数以获得正确的摘要吗?
那么,我可以有一个 std::string
保存 char
类型,并将其转换为 UTF16-LE 编码的可变长度 std::string_type 吗?是 std::u16string
还是 std::wstring
?
我会使用 s.c_str()
还是 s.data()
并且 length()
函数在这两种情况下都能正确报告?
抱歉,第一手...这将是一个带有一些长代码的丑陋回复。我最终使用了以下函数,同时有效地将 iconv
逐个文件编译到我的 windows 应用程序文件中 :)
希望对您有所帮助。
char* conver(const char* in, size_t in_len, size_t* used_len)
{
const int CC_MUL = 2; // 16 bit
setlocale(LC_ALL, "");
char* t1 = setlocale(LC_CTYPE, "");
char* locn = (char*)calloc(strlen(t1) + 1, sizeof(char));
if(locn == NULL)
{
return 0;
}
strcpy(locn, t1);
const char* enc = strchr(locn, '.') + 1;
#if _WINDOWS
std::string win = "WINDOWS-";
win += enc;
enc = win.c_str();
#endif
iconv_t foo = iconv_open("UTF-16LE", enc);
if(foo == (void*)-1)
{
if (errno == EINVAL)
{
fprintf(stderr, "Conversion from %s is not supported\n", enc);
}
else
{
fprintf(stderr, "Initialization failure:\n");
}
free(locn);
return 0;
}
size_t out_len = CC_MUL * in_len;
size_t saved_in_len = in_len;
iconv(foo, NULL, NULL, NULL, NULL);
char* converted = (char*)calloc(out_len, sizeof(char));
char *converted_start = converted;
char* t = const_cast<char*>(in);
int ret = iconv(foo,
&t,
&in_len,
&converted,
&out_len);
iconv_close(foo);
*used_len = CC_MUL * saved_in_len - out_len;
if(ret == -1)
{
switch(errno)
{
case EILSEQ:
fprintf(stderr, "EILSEQ\n");
break;
case EINVAL:
fprintf(stderr, "EINVAL\n");
break;
}
perror("iconv");
free(locn);
return 0;
}
else
{
free(locn);
return converted_start;
}
}
我认为像这样的东西应该可以解决问题:
std::string utf16_to_utf8(std::u16string const& s)
{
std::wstring_convert<std::codecvt_utf8_utf16<char16_t, 0x10ffff,
std::codecvt_mode::little_endian>, char16_t> cnv;
std::string utf8 = cnv.to_bytes(s);
if(cnv.converted() < s.size())
throw std::runtime_error("incomplete conversion");
return utf8;
}
std::u16string utf8_to_utf16(std::string const& utf8)
{
std::wstring_convert<std::codecvt_utf8_utf16<char16_t, 0x10ffff,
std::codecvt_mode::little_endian>, char16_t> cnv;
std::u16string s = cnv.from_bytes(utf8);
if(cnv.converted() < utf8.size())
throw std::runtime_error("incomplete conversion");
return s;
}
注意: std::wstring_convert 在 [=11= 中 已弃用 ] 但我仍然喜欢使用它而不是非标准库,因为它是可移植的,没有依赖关系,并且毫无疑问会一直保留到被替换。
而且,如果所有其他方法都失败了,您可以使用替代代码重新实现这些相同的功能,而无需更改应用程序的任何其他部分。
我今天搜索了几个小时,就是找不到适合我的东西。我刚刚看过的那个没有运气,是“How to convert UTF-8 encoded std::string to UTF-16 std::string”。
我的问题是,简单解释一下:
我想在标准 C++ 中制作一个有效的 NTLM 散列,并且我正在使用 OpenSSL 的库使用其 MD4 例程创建散列。我知道该怎么做,所以有人知道如何将 std::string
转换为 UTF-16 LE 编码字符串,我可以将其传递给 MD4 函数以获得正确的摘要吗?
那么,我可以有一个 std::string
保存 char
类型,并将其转换为 UTF16-LE 编码的可变长度 std::string_type 吗?是 std::u16string
还是 std::wstring
?
我会使用 s.c_str()
还是 s.data()
并且 length()
函数在这两种情况下都能正确报告?
抱歉,第一手...这将是一个带有一些长代码的丑陋回复。我最终使用了以下函数,同时有效地将 iconv
逐个文件编译到我的 windows 应用程序文件中 :)
希望对您有所帮助。
char* conver(const char* in, size_t in_len, size_t* used_len)
{
const int CC_MUL = 2; // 16 bit
setlocale(LC_ALL, "");
char* t1 = setlocale(LC_CTYPE, "");
char* locn = (char*)calloc(strlen(t1) + 1, sizeof(char));
if(locn == NULL)
{
return 0;
}
strcpy(locn, t1);
const char* enc = strchr(locn, '.') + 1;
#if _WINDOWS
std::string win = "WINDOWS-";
win += enc;
enc = win.c_str();
#endif
iconv_t foo = iconv_open("UTF-16LE", enc);
if(foo == (void*)-1)
{
if (errno == EINVAL)
{
fprintf(stderr, "Conversion from %s is not supported\n", enc);
}
else
{
fprintf(stderr, "Initialization failure:\n");
}
free(locn);
return 0;
}
size_t out_len = CC_MUL * in_len;
size_t saved_in_len = in_len;
iconv(foo, NULL, NULL, NULL, NULL);
char* converted = (char*)calloc(out_len, sizeof(char));
char *converted_start = converted;
char* t = const_cast<char*>(in);
int ret = iconv(foo,
&t,
&in_len,
&converted,
&out_len);
iconv_close(foo);
*used_len = CC_MUL * saved_in_len - out_len;
if(ret == -1)
{
switch(errno)
{
case EILSEQ:
fprintf(stderr, "EILSEQ\n");
break;
case EINVAL:
fprintf(stderr, "EINVAL\n");
break;
}
perror("iconv");
free(locn);
return 0;
}
else
{
free(locn);
return converted_start;
}
}
我认为像这样的东西应该可以解决问题:
std::string utf16_to_utf8(std::u16string const& s)
{
std::wstring_convert<std::codecvt_utf8_utf16<char16_t, 0x10ffff,
std::codecvt_mode::little_endian>, char16_t> cnv;
std::string utf8 = cnv.to_bytes(s);
if(cnv.converted() < s.size())
throw std::runtime_error("incomplete conversion");
return utf8;
}
std::u16string utf8_to_utf16(std::string const& utf8)
{
std::wstring_convert<std::codecvt_utf8_utf16<char16_t, 0x10ffff,
std::codecvt_mode::little_endian>, char16_t> cnv;
std::u16string s = cnv.from_bytes(utf8);
if(cnv.converted() < utf8.size())
throw std::runtime_error("incomplete conversion");
return s;
}
注意: std::wstring_convert 在 [=11= 中 已弃用 ] 但我仍然喜欢使用它而不是非标准库,因为它是可移植的,没有依赖关系,并且毫无疑问会一直保留到被替换。
而且,如果所有其他方法都失败了,您可以使用替代代码重新实现这些相同的功能,而无需更改应用程序的任何其他部分。