writeLines 不返回文本

writeLines is not returning text

我想显示语料库中 400 多篇文档的全部(或部分)文本内容。为此,我使用了函数 writeLines 但它不是 return 文档中包含的实际文本,而是 return 是这样的:

list(list(content = c("", ""), meta = list(author = character(0), atetimestamp = list(sec = 33.0082728862762, min = 22, hour = 12, mday = 5, mon = 8, year = 116, wday = 1, yday = 248, isdst = 0), description = character(0), heading......

我是这样编码的:

library(tm)
library(SnowballC)

#Partition each cell in Excel into separate document
textdata <- read.csv("C:/Users/biat/Documents/survey/openanswers.csv", header = FALSE)
require(tm)

doc <- Corpus(DataframeSource(textdata), readerControl = list(language="swedish"))

writeLines(as.character(doc))

问题出在 R 代码还是 CSV 文件中?当我将 writeLinesDirSource 一起使用时,它 return 就是文本。任何人都知道如何抑制上面的信息 returns 以及如何只检索文档中的文本?

尝试以下操作将文本打印到您的控制台,如果我理解得很好,这就是您要求的吗?

library(tm)
data("crude") # example set from tm
output <- sapply( crude, function(x) x$content) #get the content from your object
cat(output) # have your text outputted

ps:尝试为您的问题提供一个可重现的示例