当使用 apt 安装/从源代码编译时,R 会以不同方式处理某些字符
R handles some characters differently when installed with apt / compiled from source
来自 Ubuntu 个存储库的 R 3.4.4:
> "µV"
[1] "25V"
同一台计算机,R 3.4.4(以及 3.2.0 和 3.5.1)从 CRAN 获得的源代码编译:
> "µV"
[1] "µV"
我更喜欢第二种行为。差异从何而来?
Encoding("µV")
returns "unknown"
在第一种情况下 "UTF-8"
在第二种情况下,但是手动设置字符串变量的编码似乎并没有改善它的代表。
出于某种原因,Sys.getencoding()
在这两个版本中有所不同。 运行 Sys.setlocale("LC_COLLATE", "en_US.UTF-8")
在第一个版本中似乎已经解决了这个问题。
来自 Ubuntu 个存储库的 R 3.4.4:
> "µV"
[1] "25V"
同一台计算机,R 3.4.4(以及 3.2.0 和 3.5.1)从 CRAN 获得的源代码编译:
> "µV"
[1] "µV"
我更喜欢第二种行为。差异从何而来?
Encoding("µV")
returns "unknown"
在第一种情况下 "UTF-8"
在第二种情况下,但是手动设置字符串变量的编码似乎并没有改善它的代表。
出于某种原因,Sys.getencoding()
在这两个版本中有所不同。 运行 Sys.setlocale("LC_COLLATE", "en_US.UTF-8")
在第一个版本中似乎已经解决了这个问题。