使用 ggplot2 和特殊字符
Using ggplot2 and special characters
我正在从网站读取数据,每行都有标识文本。我只是将数据复制并粘贴到 Excel 中,然后文件由 R 读取。其中一行包含德国城市的名称 "Würzburg",其中包括一个带有变音符号的小写字母 u .我在网络上或 Excel 上看到特殊字符没有问题。问题是,当这个词被传递给 ggplot2 时,它在图中显示为 "WÃzburg",大写字母 A 上方有波浪线。RStudio 显示这两种形式,具体取决于它显示的区域。我假设 ggplot2
使用不同的语言来解释特殊字符。
有没有办法告诉 ggplot 如何读取、解释和显示特殊字符?我不想只为这个城市写专门的代码,而是要解决一般的问题。随着时间的推移,我很可能会遇到其他角色。
读取文件如下
library('data.table')
fread('path_to_file', ..., encoding = 'UTF-8')
我在 ggplot2
中遇到了类似的错误,当我使用硬编码 data.frame
时(即,我会写 Großbritannien(英国),它会被编码成一些乱码)。
我的解决方案是包括
Sys.setlocale("LC_ALL", "German")
options(encoding = "UTF-8")
在脚本的开头。
我对这个问题的解决方案是切换到 cairo 进行 pdf 绘图。 ggplot2 正确显示所有特殊字符。 knitr设置中放这行代码就可以了:
knitr::opts_chunk$set(dev='cairo_pdf')
我正在从网站读取数据,每行都有标识文本。我只是将数据复制并粘贴到 Excel 中,然后文件由 R 读取。其中一行包含德国城市的名称 "Würzburg",其中包括一个带有变音符号的小写字母 u .我在网络上或 Excel 上看到特殊字符没有问题。问题是,当这个词被传递给 ggplot2 时,它在图中显示为 "WÃzburg",大写字母 A 上方有波浪线。RStudio 显示这两种形式,具体取决于它显示的区域。我假设 ggplot2
使用不同的语言来解释特殊字符。
有没有办法告诉 ggplot 如何读取、解释和显示特殊字符?我不想只为这个城市写专门的代码,而是要解决一般的问题。随着时间的推移,我很可能会遇到其他角色。
读取文件如下
library('data.table')
fread('path_to_file', ..., encoding = 'UTF-8')
我在 ggplot2
中遇到了类似的错误,当我使用硬编码 data.frame
时(即,我会写 Großbritannien(英国),它会被编码成一些乱码)。
我的解决方案是包括
Sys.setlocale("LC_ALL", "German")
options(encoding = "UTF-8")
在脚本的开头。
我对这个问题的解决方案是切换到 cairo 进行 pdf 绘图。 ggplot2 正确显示所有特殊字符。 knitr设置中放这行代码就可以了:
knitr::opts_chunk$set(dev='cairo_pdf')