为什么 wstring_convert 抛出 range_error?
Why is wstring_convert throwing a range_error?
我正在编写一些需要使用系统语言环境在字节字符串和宽字符串之间进行转换的代码。从文件中读取时,这非常容易做到。我可以使用 std::wifstream
,用 std::locale("")
填充它,然后只使用 std::getline
.
根据 cppreference 的 codecvt 页面,wifstream
仅使用 codecvt<wchar_t, char, mbstate_t>
,所以我认为我可以在 std::string
和 std::wstring
之间转换也可以使用它:
// utility wrapper to adapt locale-bound facets for wstring/wbuffer
convert
template<class Facet>
struct deletable_facet : Facet
{
template<class ...Args>
deletable_facet(Args&& ...args) : Facet(std::forward<Args>(args)...) {}
~deletable_facet() {}
};
std::locale::global(std::locale(""));
std::wstring_convert<
deletable_facet<std::codecvt<wchar_t, char, std::mbstate_t>>> wconv;
std::wstring wstr = wconv.from_bytes(data);
但是,当我尝试 运行 时,我从 wstring_convert
抛出一个 range_error
。我做了一些谷歌搜索,显然这就是 wstring_convert
无法转换字符串时发生的情况。
然而,这些字符串显然完全可以使用 wfstream
进行转换,它应该使用与我使用 wstring_convert
相同的 codecvt
。那么为什么 wifstream
有效,而 wstring_convert
无效呢?
有没有一种方法可以使用系统的语言环境在 string
s 和 wstring
s 之间进行转换?
我的问题的完整示例改编自 codecvt 页面,此处,输出为:
sizeof(char32_t) = 4
sizeof(wchar_t) = 4
The UTF-8 file contains the following UCS4 code points:
U+007a
U+00df
U+6c34
U+1f34c
The UTF-8 string contains the following UCS4 code points:
U+007a
U+00df
U+6c34
U+1f34c
terminate called after throwing an instance of 'std::range_error'
what(): wstring_convert
Aborted (core dumped)
您的wifstream
和 wstring_convert
使用不同的方面。
wifstream
正在使用依赖于语言环境的转换方面;它通过 std::use_facet
从 std::locale("")
中提取出来
wstring_convert
被赋予了一个与语言环境无关的、独立的 codecvt facet,而您的实现提供的 codecvt facet 显然不会将 UTF-8 转换为任何合适的东西;尝试直接调用 in 以查看它的作用。
获取依赖于区域设置的方面的一种简单方法是按名称请求它,如
std::codecvt_byname
我正在编写一些需要使用系统语言环境在字节字符串和宽字符串之间进行转换的代码。从文件中读取时,这非常容易做到。我可以使用 std::wifstream
,用 std::locale("")
填充它,然后只使用 std::getline
.
根据 cppreference 的 codecvt 页面,wifstream
仅使用 codecvt<wchar_t, char, mbstate_t>
,所以我认为我可以在 std::string
和 std::wstring
之间转换也可以使用它:
// utility wrapper to adapt locale-bound facets for wstring/wbuffer
convert
template<class Facet>
struct deletable_facet : Facet
{
template<class ...Args>
deletable_facet(Args&& ...args) : Facet(std::forward<Args>(args)...) {}
~deletable_facet() {}
};
std::locale::global(std::locale(""));
std::wstring_convert<
deletable_facet<std::codecvt<wchar_t, char, std::mbstate_t>>> wconv;
std::wstring wstr = wconv.from_bytes(data);
但是,当我尝试 运行 时,我从 wstring_convert
抛出一个 range_error
。我做了一些谷歌搜索,显然这就是 wstring_convert
无法转换字符串时发生的情况。
然而,这些字符串显然完全可以使用 wfstream
进行转换,它应该使用与我使用 wstring_convert
相同的 codecvt
。那么为什么 wifstream
有效,而 wstring_convert
无效呢?
有没有一种方法可以使用系统的语言环境在 string
s 和 wstring
s 之间进行转换?
我的问题的完整示例改编自 codecvt 页面,此处,输出为:
sizeof(char32_t) = 4
sizeof(wchar_t) = 4
The UTF-8 file contains the following UCS4 code points:
U+007a
U+00df
U+6c34
U+1f34c
The UTF-8 string contains the following UCS4 code points:
U+007a
U+00df
U+6c34
U+1f34c
terminate called after throwing an instance of 'std::range_error'
what(): wstring_convert
Aborted (core dumped)
您的wifstream
和 wstring_convert
使用不同的方面。
wifstream
正在使用依赖于语言环境的转换方面;它通过 std::use_facet
std::locale("")
中提取出来
wstring_convert
被赋予了一个与语言环境无关的、独立的 codecvt facet,而您的实现提供的 codecvt facet 显然不会将 UTF-8 转换为任何合适的东西;尝试直接调用 in 以查看它的作用。
获取依赖于区域设置的方面的一种简单方法是按名称请求它,如 std::codecvt_byname