RStudio 字符编码问题:引号替换为 \x92

RStudio character encoding issue: quotation marks replaced by \x92

我是 reading.csv 一个包含一些自然出现的文本的文件。有时在文本中,' 用作撇号,有时使用 '(参见 this table 的第 2 行和第 6 行)。

在我的笔记本电脑上读取 RStudio 中的文件时,我没有遇到任何问题(' 和 ' 都在文本中)。但是,在 Rstudio 服务器(EC2 实例)中读取文件时,所有的 ’ 都被 \x92 替换,这是一个问题。

根据 this question 第一个答案的第一个要点,我尝试通过 RStudio 服务器中的全局选项菜单更改编码:Unicode、UTF-8、UTF-16、Windows-1252、ISO8859-1等

不幸的是,无论我的选择如何,每次都会出现同样的问题。

非常感谢您的帮助。

我刚刚找到了解决方案,所以我正在回答我自己的问题:

不知何故,我尝试通过 RStudio 服务器中的全局选项菜单设置编码对 read.csv 没有任何影响(我认为默认情况下它应该使用全局选项中指定的编码 getOption("encoding"), 但似乎并不总是这样...)

无论如何,通过使用 fileEncoding 参数直接在 read.csv 中指定编码类型,并通过检查数据,我可以看到这次我的不同编码选择产生了影响。经过几次试验,我发现 "Windows-1252" 给了我想要的东西。