当使用 apt 安装/从源代码编译时,R 会以不同方式处理某些字符

R handles some characters differently when installed with apt / compiled from source

来自 Ubuntu 个存储库的 R 3.4.4:

> "µV"
[1] "25V"

同一台计算机,R 3.4.4(以及 3.2.0 和 3.5.1)从 CRAN 获得的源代码编译:

> "µV"
[1] "µV"

我更喜欢第二种行为。差异从何而来?

Encoding("µV") returns "unknown" 在第一种情况下 "UTF-8" 在第二种情况下,但是手动设置字符串变量的编码似乎并没有改善它的代表。

出于某种原因,Sys.getencoding() 在这两个版本中有所不同。 运行 Sys.setlocale("LC_COLLATE", "en_US.UTF-8") 在第一个版本中似乎已经解决了这个问题。