stod 无法与 boost::locale 一起正常工作
stod does not work correctly with boost::locale
我正在尝试在德语语言环境中同时使用 boost::locale 和 std::stod,其中逗号是小数点分隔符。考虑这段代码:
boost::locale::generator gen;
std::locale loc(""); // (1)
//std::locale loc = gen(""); // (2)
std::locale::global(loc);
std::cout.imbue(loc);
std::string s = "1,1"; //float string in german locale!
double d1 = std::stod(s);
std::cout << "d1: " << d1 << std::endl;
double d2 = 2.2;
std::cout << "d2: " << d2 << std::endl;
std::locale loc("") 创建正确的语言环境,输出为
d1: 1,1
d2: 2,2
如我所料。当我注释掉第 (1) 行和取消注释第 (2) 行时,输出是
d1: 1
d2: 2.2
d2 的结果在意料之中。据我了解 boost::locale 要我明确指定 d2 应格式化为数字并执行
std::cout << "d2: " << boost::locale::as::number << d2 << std::endl;
再次将输出固定为 2,2。问题是 std::stod 不再将 1,1 视为有效的浮点数并将其截断为 1。
我的问题是:
为什么当我使用 boost::locale 生成语言环境时 std::stod 停止工作?
附加信息:我正在使用 VC++2015,Boost 1.60,无 ICU,Windows10
更新:
我注意到当我两次设置全局语言环境时问题已解决,首先是 std::locale("") 然后是 boost:
std::locale::global(std::locale(""));
bl::generator gen;
std::locale::global(gen(""));
不过我不知道为什么会这样!
长话短说: boost::locale
仅更改全局 c++-locale 对象,而不更改 C-locale。 stod
使用 C-locale 而不是全局 c++-locale 对象。 std::locale
同时更改:全局 c++-locale 对象和 C 语言环境。
整个故事: std::locale
是个微妙的东西,负责大量调试!
让我们从 C++ 开始 class std::locale:
std::locale loc("de_DE.utf8");
std::cout<<loc.name()<<"\n\n\n";
创建德语语言环境(如果它在您的机器上可用,否则会抛出),这会在控制台上产生 de_DE.utf8
。
但是它不会更改 global c++ locale 对象,它是在程序的 start-up 处创建的并且是 classical ("C"). std::locale
的构造函数不带参数 return 是全局状态的副本:
...
std::locale loc2;
std::cout<<loc2.name()<<"\n\n\n";
现在您应该会看到 C
如果您之前的语言环境没有任何问题。 std::locale("") 会施展魔法,找出用户的偏好,return 将其作为对象,无需 更改全局状态。
您可以使用 std::local::global
更改本地状态:
std::locale::global(loc);
std::locale loc3;
std::cout<<loc3.name()<<"\n\n\n";
默认构造函数这次在控制台上生成 de_DE.utf8
。
我们可以通过调用将全局状态恢复到 classical:
std::locale::global(std::locale::classic());
std::locale loc4;
std::cout<<loc4.name()<<"\n\n\n";
这应该会再次给你 C
。
现在,当创建 std::cout 时,它会从全局 c++ 状态克隆其语言环境(这里我们使用字符串流来执行此操作,但它是相同的)。稍后更改全局状态不会影响流:
//classical formating
std::stringstream c_stream;
//german formating:
std::locale::global(std::locale("de_DE.utf8"));
std::stringstream de_stream;
//same global locale, different results:
c_stream<<1.1;
de_stream<<1.1;
std::cout<<c_stream.str()<<" vs. "<<de_stream.str()<<"\n";
给你 1.1 vs. 1,1
- 第一个是 classical 第二个是德语
您可以使用 imbue(std::locale::classic())
更改流的本地 locale-object 不用说,这不会更改全局状态:
de_stream.imbue(std::locale::classic());
de_stream<<" vs. "<<1.1;
std::cout<<de_stream.str()<<"\n";
std::cout<<"global c++ state: "<<std::locale().name()<<"\n";
你看:
1,1 vs. 1.1
global c++ state: de_DE.utf8
现在我们来到 std::stod
。你可以想象它使用全局 c++ 语言环境(不完全正确,请耐心等待)状态而不是 cout
-stream:
的(私有)状态
std::cout<<std::stod("1.1")<<" vs. "<<std::stod("1,1")<<"\n";
给你1 vs. 1.1
因为全局状态仍然是"de_DE.utf8"
,所以第一个解析停止在'.'
但是std::cout
的本地状态仍然是[=46] =].恢复全局状态后,我们得到 classical 行为:
std::locale::global(std::locale::classic());
std::cout<<std::stod("1.1")<<" vs. "<<std::stod("1,1")<<"\n";
现在德语 "1,1"
未正确解析:1.1 vs. 1
现在您可能认为我们已经完成了,但还有更多 - 我答应告诉您 std::stod
。
在全局 c++ 语言环境旁边有所谓的(全局)C 语言环境(来自 C 语言,不要与 classical "C" 语言环境混淆)。每次我们更改全局 c++ 语言环境时,C 语言环境也已更改。
C语言环境的Getting/setting可以用std::setlocale(...)
完成。查询当前值 运行:
std::cout<<"(global) C locale is "<<std::setlocale(LC_ALL,NULL)<<"\n";
查看(global) C locale is C
。设置C语言环境运行:
assert(std::setlocale(LC_ALL,"de_DE.utf8")!=NULL);
std::cout<<"(global) C locale is "<<std::setlocale(LC_ALL,NULL)<<"\n";
产生 (global) C locale is de_DE.utf8
。但是现在全局 c++ 语言环境是什么?
std::cout<<"global c++ state: "<<std::locale().name()<<"\n";
如您所料,C 对 c++ 全局区域设置一无所知,并保持不变:global c++ state: C
。
现在我们不在堪萨斯了!旧的 c-functions 将使用 C-locale 和新的 c++ 函数全局 c++。准备好进行有趣的调试!
你会期待什么
std::cout<<"C: "<<std::stod("1.1")<<" vs. DE :"<<std::stod("1,1")<<"\n";
要做什么? std::stod
毕竟是一个 brand-new c++11 函数,它应该使用全局 c++ 语言环境!再想想...:[=57=]
1 vs. 1.1
它获得了正确的德语格式,因为 C-locale 设置为 'de_DE.utf8' 并且它在幕后使用旧的 C-style 函数。
为了完整起见,std::streams
使用全局 c++ 语言环境:
std::stringstream stream;//creating with global c++ locale
stream<<1.1;
std::cout<<"I'm still in 'C' format: "<<stream.str()<<"\n";
给你:I'm still in 'C' format: 1.1
.
编辑: 另一种解析字符串的方法,不会弄乱全局区域设置或被它打扰:
bool s2d(const std::string &str, double &val, const std::locale &loc=std::locale::classic()){
std::stringstream ss(str);
ss.imbue(loc);
ss>>val;
return ss.eof() && //all characters interpreted
!ss.fail(); //nothing went wrong
}
以下测试显示:
double d=0;
std::cout<<"1,1 parsed with German locale successfully :"<<s2d("1,1", d, std::locale("de_DE.utf8"))<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
d=0;
std::cout<<"1,1 parsed with Classical locale successfully :"<<s2d("1,1", d, std::locale::classic())<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
d=0;
std::cout<<"1.1 parsed with German locale successfully :"<<s2d("1.1", d, std::locale("de_DE.utf8"))<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
d=0;
std::cout<<"1.1 parsed with Classical locale successfully :"<<s2d("1.1", d, std::locale::classic())<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
只有第一次和最后一次转换成功:
1,1 parsed with German locale successfully :1
value retrieved: 1.1
1,1 parsed with Classical locale successfully :0
value retrieved: 1
1.1 parsed with German locale successfully :0
value retrieved: 11
1.1 parsed with Classical locale successfully :1
value retrieved: 1.1
std::stringstream 可能不是最快的,但有其优点...
我正在尝试在德语语言环境中同时使用 boost::locale 和 std::stod,其中逗号是小数点分隔符。考虑这段代码:
boost::locale::generator gen;
std::locale loc(""); // (1)
//std::locale loc = gen(""); // (2)
std::locale::global(loc);
std::cout.imbue(loc);
std::string s = "1,1"; //float string in german locale!
double d1 = std::stod(s);
std::cout << "d1: " << d1 << std::endl;
double d2 = 2.2;
std::cout << "d2: " << d2 << std::endl;
std::locale loc("") 创建正确的语言环境,输出为
d1: 1,1
d2: 2,2
如我所料。当我注释掉第 (1) 行和取消注释第 (2) 行时,输出是
d1: 1
d2: 2.2
d2 的结果在意料之中。据我了解 boost::locale 要我明确指定 d2 应格式化为数字并执行
std::cout << "d2: " << boost::locale::as::number << d2 << std::endl;
再次将输出固定为 2,2。问题是 std::stod 不再将 1,1 视为有效的浮点数并将其截断为 1。
我的问题是: 为什么当我使用 boost::locale 生成语言环境时 std::stod 停止工作?
附加信息:我正在使用 VC++2015,Boost 1.60,无 ICU,Windows10
更新:
我注意到当我两次设置全局语言环境时问题已解决,首先是 std::locale("") 然后是 boost:
std::locale::global(std::locale(""));
bl::generator gen;
std::locale::global(gen(""));
不过我不知道为什么会这样!
长话短说: boost::locale
仅更改全局 c++-locale 对象,而不更改 C-locale。 stod
使用 C-locale 而不是全局 c++-locale 对象。 std::locale
同时更改:全局 c++-locale 对象和 C 语言环境。
整个故事: std::locale
是个微妙的东西,负责大量调试!
让我们从 C++ 开始 class std::locale:
std::locale loc("de_DE.utf8");
std::cout<<loc.name()<<"\n\n\n";
创建德语语言环境(如果它在您的机器上可用,否则会抛出),这会在控制台上产生 de_DE.utf8
。
但是它不会更改 global c++ locale 对象,它是在程序的 start-up 处创建的并且是 classical ("C"). std::locale
的构造函数不带参数 return 是全局状态的副本:
...
std::locale loc2;
std::cout<<loc2.name()<<"\n\n\n";
现在您应该会看到 C
如果您之前的语言环境没有任何问题。 std::locale("") 会施展魔法,找出用户的偏好,return 将其作为对象,无需 更改全局状态。
您可以使用 std::local::global
更改本地状态:
std::locale::global(loc);
std::locale loc3;
std::cout<<loc3.name()<<"\n\n\n";
默认构造函数这次在控制台上生成 de_DE.utf8
。
我们可以通过调用将全局状态恢复到 classical:
std::locale::global(std::locale::classic());
std::locale loc4;
std::cout<<loc4.name()<<"\n\n\n";
这应该会再次给你 C
。
现在,当创建 std::cout 时,它会从全局 c++ 状态克隆其语言环境(这里我们使用字符串流来执行此操作,但它是相同的)。稍后更改全局状态不会影响流:
//classical formating
std::stringstream c_stream;
//german formating:
std::locale::global(std::locale("de_DE.utf8"));
std::stringstream de_stream;
//same global locale, different results:
c_stream<<1.1;
de_stream<<1.1;
std::cout<<c_stream.str()<<" vs. "<<de_stream.str()<<"\n";
给你 1.1 vs. 1,1
- 第一个是 classical 第二个是德语
您可以使用 imbue(std::locale::classic())
更改流的本地 locale-object 不用说,这不会更改全局状态:
de_stream.imbue(std::locale::classic());
de_stream<<" vs. "<<1.1;
std::cout<<de_stream.str()<<"\n";
std::cout<<"global c++ state: "<<std::locale().name()<<"\n";
你看:
1,1 vs. 1.1
global c++ state: de_DE.utf8
现在我们来到 std::stod
。你可以想象它使用全局 c++ 语言环境(不完全正确,请耐心等待)状态而不是 cout
-stream:
std::cout<<std::stod("1.1")<<" vs. "<<std::stod("1,1")<<"\n";
给你1 vs. 1.1
因为全局状态仍然是"de_DE.utf8"
,所以第一个解析停止在'.'
但是std::cout
的本地状态仍然是[=46] =].恢复全局状态后,我们得到 classical 行为:
std::locale::global(std::locale::classic());
std::cout<<std::stod("1.1")<<" vs. "<<std::stod("1,1")<<"\n";
现在德语 "1,1"
未正确解析:1.1 vs. 1
现在您可能认为我们已经完成了,但还有更多 - 我答应告诉您 std::stod
。
在全局 c++ 语言环境旁边有所谓的(全局)C 语言环境(来自 C 语言,不要与 classical "C" 语言环境混淆)。每次我们更改全局 c++ 语言环境时,C 语言环境也已更改。
C语言环境的Getting/setting可以用std::setlocale(...)
完成。查询当前值 运行:
std::cout<<"(global) C locale is "<<std::setlocale(LC_ALL,NULL)<<"\n";
查看(global) C locale is C
。设置C语言环境运行:
assert(std::setlocale(LC_ALL,"de_DE.utf8")!=NULL);
std::cout<<"(global) C locale is "<<std::setlocale(LC_ALL,NULL)<<"\n";
产生 (global) C locale is de_DE.utf8
。但是现在全局 c++ 语言环境是什么?
std::cout<<"global c++ state: "<<std::locale().name()<<"\n";
如您所料,C 对 c++ 全局区域设置一无所知,并保持不变:global c++ state: C
。
现在我们不在堪萨斯了!旧的 c-functions 将使用 C-locale 和新的 c++ 函数全局 c++。准备好进行有趣的调试!
你会期待什么
std::cout<<"C: "<<std::stod("1.1")<<" vs. DE :"<<std::stod("1,1")<<"\n";
要做什么? std::stod
毕竟是一个 brand-new c++11 函数,它应该使用全局 c++ 语言环境!再想想...:[=57=]
1 vs. 1.1
它获得了正确的德语格式,因为 C-locale 设置为 'de_DE.utf8' 并且它在幕后使用旧的 C-style 函数。
为了完整起见,std::streams
使用全局 c++ 语言环境:
std::stringstream stream;//creating with global c++ locale
stream<<1.1;
std::cout<<"I'm still in 'C' format: "<<stream.str()<<"\n";
给你:I'm still in 'C' format: 1.1
.
编辑: 另一种解析字符串的方法,不会弄乱全局区域设置或被它打扰:
bool s2d(const std::string &str, double &val, const std::locale &loc=std::locale::classic()){
std::stringstream ss(str);
ss.imbue(loc);
ss>>val;
return ss.eof() && //all characters interpreted
!ss.fail(); //nothing went wrong
}
以下测试显示:
double d=0;
std::cout<<"1,1 parsed with German locale successfully :"<<s2d("1,1", d, std::locale("de_DE.utf8"))<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
d=0;
std::cout<<"1,1 parsed with Classical locale successfully :"<<s2d("1,1", d, std::locale::classic())<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
d=0;
std::cout<<"1.1 parsed with German locale successfully :"<<s2d("1.1", d, std::locale("de_DE.utf8"))<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
d=0;
std::cout<<"1.1 parsed with Classical locale successfully :"<<s2d("1.1", d, std::locale::classic())<<"\n";
std::cout<<"value retrieved: "<<d<<"\n\n";
只有第一次和最后一次转换成功:
1,1 parsed with German locale successfully :1
value retrieved: 1.1
1,1 parsed with Classical locale successfully :0
value retrieved: 1
1.1 parsed with German locale successfully :0
value retrieved: 11
1.1 parsed with Classical locale successfully :1
value retrieved: 1.1
std::stringstream 可能不是最快的,但有其优点...