编码 Readlines() 的问题,特殊字符
Problem with encoding Readlines(), special character
我的文件中有一些重音符号,我试图用正确的编码打开这个文件,但每次我打开这个文件时,我的重音符号都会出现特殊字符 (),尽管我提到过使用编码打开文件 = UTF-8
mes_keywords_to_check <- readLines("mot cle holidays.txt", encoding='UTF-8')
你知道问题出在哪里吗?
我可以重现你的问题:
temp <- tempfile(fileext = ".txt")
write("Ole Gunnar Solskjær", temp)
readLines(temp, encoding = "UTF-8")
[1] "Ole Gunnar Solskj\xe6r"
但是,在我的例子中,通过省略 readLines
中的编码参数(或使用 latin1
而不是 UTF-8
)解决了这个问题:
readLines(temp)
[1] "Ole Gunnar Solskjær"
readLines(temp, encoding = "latin1")
[1] "Ole Gunnar Solskjær"
我的文件中有一些重音符号,我试图用正确的编码打开这个文件,但每次我打开这个文件时,我的重音符号都会出现特殊字符 (),尽管我提到过使用编码打开文件 = UTF-8
mes_keywords_to_check <- readLines("mot cle holidays.txt", encoding='UTF-8')
你知道问题出在哪里吗?
我可以重现你的问题:
temp <- tempfile(fileext = ".txt")
write("Ole Gunnar Solskjær", temp)
readLines(temp, encoding = "UTF-8")
[1] "Ole Gunnar Solskj\xe6r"
但是,在我的例子中,通过省略 readLines
中的编码参数(或使用 latin1
而不是 UTF-8
)解决了这个问题:
readLines(temp)
[1] "Ole Gunnar Solskjær"
readLines(temp, encoding = "latin1")
[1] "Ole Gunnar Solskjær"