导入带有特殊字符的 .xlsx 文件
Importing .xlsx file with special characters
我正在使用 XLConnect 包中的函数 readWorksheet 在 R 中导入 Excel 工作表。这些工作表包含 R 不能很好处理的特殊字符(例如 ø、õ、ú)。据我所知,函数 readWorksheet 没有 "encoding" 参数,因为 read.csv 函数有。
这是我目前所做的:
data <- readWorksheet(loadWorkbook("data.xlsx"), sheet = 5)
有什么选项可以让 R 知道我有特殊字符吗?
我在 macOS Sierra 10.12.1 上使用 RStudio 0.99.903。
这是 UTF-8 字母 table http://www.utf8-chartable.de/
我将包 xlsx 用于 excel 个文件:
read.xlsx(file = ".xlsx", sheetName = "Arkusz1", encoding = "UTF-8", stringsAsFactors = F)
这是波兰语,但 print 和 read.xlsx 会读出所有字母,例如“ś”、“ć”等
[27] "Niewłaściwa kwalifikacja memoriałowa przychodu"
[28] "Niewłaściwe ceny transferowe"
[29] "niewłaściwe zarządzanie relacjami z kontrahentami"
最后,如果您无法读取 xlsx,只需将 excel 保存为 .csv 并使用
编码读取 csv
我正在使用 XLConnect 包中的函数 readWorksheet 在 R 中导入 Excel 工作表。这些工作表包含 R 不能很好处理的特殊字符(例如 ø、õ、ú)。据我所知,函数 readWorksheet 没有 "encoding" 参数,因为 read.csv 函数有。
这是我目前所做的:
data <- readWorksheet(loadWorkbook("data.xlsx"), sheet = 5)
有什么选项可以让 R 知道我有特殊字符吗?
我在 macOS Sierra 10.12.1 上使用 RStudio 0.99.903。
这是 UTF-8 字母 table http://www.utf8-chartable.de/
我将包 xlsx 用于 excel 个文件:
read.xlsx(file = ".xlsx", sheetName = "Arkusz1", encoding = "UTF-8", stringsAsFactors = F)
这是波兰语,但 print 和 read.xlsx 会读出所有字母,例如“ś”、“ć”等
[27] "Niewłaściwa kwalifikacja memoriałowa przychodu"
[28] "Niewłaściwe ceny transferowe"
[29] "niewłaściwe zarządzanie relacjami z kontrahentami"
最后,如果您无法读取 xlsx,只需将 excel 保存为 .csv 并使用
编码读取 csv