文本挖掘中的 getText 函数是什么?它从何而来? [r]

what is getText function in text-mining? Where does it come from? [r]

我正在关注 Nathan Dannerman 和 Richard Heimann 的 Social Media Mining with R 中的文本挖掘示例:The Book。使用 searchTwitter 函数提取推文后,作者在 list 上使用 sapply 提取文本部分,如下所示:

rstats <- searchTwitter("#rstats", n = 1000)

rstats_list <- sapply(rstats, function (x) x$getText())

这巧妙地制作了一个字符向量,其中仅包含来自推文的文本部分。什么是 getText() ?我在任何地方都找不到任何东西 - 作者没有充分解释。我查看了 tm 包文档 - 没有!我在 SO - Getting Text From Tweets The answerer is asking the same question as I. On Inside-R, I found this: http://www.inside-r.org/r-doc/base/gettext 上寻找与此相关的问题,但它与 getText 不同。有人可以解释我所缺少的吗?

getText 是 'status' class 的访问器方法,如下所述:http://www.inside-r.org/howto/mining-twitter-airline-consumer-sentiment.

抱歉没有在正文中澄清, 内森·丹尼曼

getText() 用于提取推文文本内容的函数

Exp:

rstats <- searchTwitter("#rstats", n = 1000)

rstats[[1]]$$getText()

使用 twitteR 库处理推文数据。

一些使用完整的功能来处理推文:

getScreenName(), getId(), getCreated()

创建列表后 "rstats" 如果您在环境中(在 RStudio 中)检查它,它会显示每条推文以及每条推文的所有相关信息并显示一些访问权限每个方法下面。您可以在那里检查 getText() 以获取每条推文的文本内容。