如何将默认的 UTF-8 编码更改为 LATIN1
How change the default UTF-8 encoding to LATIN1
第一次来电。
我只想将字符串编码从 UTF-8 更改为 LATIN1。我使用 Xpath 从网络检索数据:
>library(RCurl)
>library(rvest)
>library(XML)
>library(httr)
>library(reshape2)
>library(reshape)
>response <- GET(paste0("http://www.visalietuva.lt/imone/jogminda-uab-telsiai-muziejaus-g-35"))
>doc <- content(response,type="text/html")
>base <- xpathSApply(doc, "//ul//li//span",xmlValue)[5]
结果我得到以下信息:
>base
[1] "El. paštas"
当我检查编码时我有 UTF-8:
>Encoding(base)
[1] "UTF-8"
我怀疑我需要 LATIN1 编码。这样结果就是 "El. paštas",而不是 "El. paÅ¡tas".
虽然当我指定 LATIN1 编码时,我得到以下信息:
>latin <- iconv(base, from = "UTF-8", to = "LATIN1")
[1] "El. paštas"
即与 UTF-8 相同的结果。更改编码无助于获得 "El. paštas".
此外,在将数据保存到 .csv 文件时,我需要对字符串进行正确的 LATIN1 编码。我试图将数据保存到 .csv:
write.table(latin,file = "test.csv")
得到和上面一样的奇怪字符:"El. paÅ¡tas".
我们非常欢迎任何关于如何更改编码的建议。谢谢。
尝试
doc <- content(response,type="text/html", encoding = "UTF-8")
第一次来电。
我只想将字符串编码从 UTF-8 更改为 LATIN1。我使用 Xpath 从网络检索数据:
>library(RCurl)
>library(rvest)
>library(XML)
>library(httr)
>library(reshape2)
>library(reshape)
>response <- GET(paste0("http://www.visalietuva.lt/imone/jogminda-uab-telsiai-muziejaus-g-35"))
>doc <- content(response,type="text/html")
>base <- xpathSApply(doc, "//ul//li//span",xmlValue)[5]
结果我得到以下信息:
>base
[1] "El. paštas"
当我检查编码时我有 UTF-8:
>Encoding(base)
[1] "UTF-8"
我怀疑我需要 LATIN1 编码。这样结果就是 "El. paštas",而不是 "El. paÅ¡tas".
虽然当我指定 LATIN1 编码时,我得到以下信息:
>latin <- iconv(base, from = "UTF-8", to = "LATIN1")
[1] "El. paštas"
即与 UTF-8 相同的结果。更改编码无助于获得 "El. paštas".
此外,在将数据保存到 .csv 文件时,我需要对字符串进行正确的 LATIN1 编码。我试图将数据保存到 .csv:
write.table(latin,file = "test.csv")
得到和上面一样的奇怪字符:"El. paÅ¡tas".
我们非常欢迎任何关于如何更改编码的建议。谢谢。
尝试
doc <- content(response,type="text/html", encoding = "UTF-8")