如何让 R 阅读所有其他人类语言?

How to get R to read all the other human languages?

谁能告诉我如何让 R 正常显示所有人类语言。我的问题是我有一个数据框,其中包含以欧盟所有语言编写的新闻文章标题。糟糕的数据库设计评论,我怎样才能让 R 以其各自的语言显示每一行?

我读过 this R bloggers post 并且将 Sys.setlocale 更改为其中一种语言是有意义的,但是最后执行的命令才是最重要的。将数据库手动分离到每个语言库和 运行 每种语言的脚本是可能的,但我宁愿不这样做。

感恩!

编辑:

Link to base .xls document

要导入的 R 代码:

 library(data.table)
library(XLConnect)
library(stringr)
library(stringi)
library(dplyr)

#load .xls
wb <- loadWorkbook('D:/MOMUT1/GIS_Workload/Other/alex/Book2_1.xls')
df <- readWorksheet(wb, 1, header = TRUE)

#remove NAs
df_final <- subset(df, !is.na(df$HEADLINE))

#take out HEADLINE column to work on
head_col <- data.table(df_final$HEADLINE)

运行 开启:Windows 10 Pro 1803 64 位 RStudio 3.4.4

处理多种语言时的一个解决方案是 运行 R in Linux,其中 UTF-8 是标准编码。由于您使用的是 Win 10 Pro,因此您可以在 Windows Subsystem for Linux 中执行此操作,而无需从头开始安装 OS。

  1. 安装 WSL:https://docs.microsoft.com/en-us/windows/wsl/install-win10(Ubuntu 可能是发行版的最佳选择)
  2. 安装 R:http://sites.psu.edu/theubunturblog/installing-r-in-ubuntu/
  3. 通过 install.packages 安装您需要的任何软件包。您可能必须自己安装系统库依赖项。
  4. 运行你的分析。

警告:我还没有真正尝试过这个。此外,您将从命令行 运行ning R 而不是使用 RStudio。