R中的编码:<> unicode到字母

Encoding in R : <> unicode to letter

我在使用 RFacebook 软件包从帖子中提取评论时遇到问题。

localiza <- getPage(543362459038077,token = my_oauth,n=10)
post <- getPost(post = localiza$id[1], token = my_oauth) here

问题出在输出的编码上。例如:

algu/U+00E9/m

请注意,输出有 <>

而不是“/”

例如,该词应显示为

alguém

有什么建议吗?

提前致谢!

考虑改变您的 localeRfacebook 不是问题。我可以通过将区域设置设置为 C 来复制您描述的行为,例如

x <- "Boa tarde. Há alguém de plantão na agência esses dias?"
Sys.setlocale(locale = "C")
x
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?"

通过将字符集处理的语言环境切换到具有扩展字符集的语言环境,可以实现所需的输出,例如

Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8")
x
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?"

locale 参数的值在您的系统上可能不同。有关设置语言环境的详细信息,请参阅 https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html(或 ?locales)。