R中的编码:<> unicode到字母
Encoding in R : <> unicode to letter
我在使用 RFacebook 软件包从帖子中提取评论时遇到问题。
localiza <- getPage(543362459038077,token = my_oauth,n=10)
post <- getPost(post = localiza$id[1], token = my_oauth) here
问题出在输出的编码上。例如:
algu/U+00E9/m
请注意,输出有 <>
而不是“/”
例如,该词应显示为
alguém
有什么建议吗?
提前致谢!
考虑改变您的 locale
。 Rfacebook
不是问题。我可以通过将区域设置设置为 C
来复制您描述的行为,例如
x <- "Boa tarde. Há alguém de plantão na agência esses dias?"
Sys.setlocale(locale = "C")
x
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?"
通过将字符集处理的语言环境切换到具有扩展字符集的语言环境,可以实现所需的输出,例如
Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8")
x
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?"
locale
参数的值在您的系统上可能不同。有关设置语言环境的详细信息,请参阅 https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html(或 ?locales
)。
我在使用 RFacebook 软件包从帖子中提取评论时遇到问题。
localiza <- getPage(543362459038077,token = my_oauth,n=10)
post <- getPost(post = localiza$id[1], token = my_oauth) here
问题出在输出的编码上。例如:
algu/U+00E9/m
请注意,输出有 <>
而不是“/”例如,该词应显示为
alguém
有什么建议吗?
提前致谢!
考虑改变您的 locale
。 Rfacebook
不是问题。我可以通过将区域设置设置为 C
来复制您描述的行为,例如
x <- "Boa tarde. Há alguém de plantão na agência esses dias?"
Sys.setlocale(locale = "C")
x
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?"
通过将字符集处理的语言环境切换到具有扩展字符集的语言环境,可以实现所需的输出,例如
Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8")
x
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?"
locale
参数的值在您的系统上可能不同。有关设置语言环境的详细信息,请参阅 https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html(或 ?locales
)。