如何将列表转换为 r 中的语料库?

How transform a list into a corpus in r?

在这个 中,我询问了如何拆分一个巨大的数据框来创建一个语料库。多亏了答案,我才能够从数据框中创建一个列表。 我的问题仍然是 从我创建的列表中获取语料库 以便进行一些文本挖掘并根据搜索词对数据进行聚类。

为了解决这个问题,我只是将 tm 包的 as.VCorpus 功能应用到我之前创建的列表中:

new_corpus <- as.VCorpus(new_list)

检查新对象是否是语料库:

class(new_corpus)
[1] "VCorpus" "Corpus" 

我就这样创建了一个"volatile corpus"。如 R 文档中所写:

A volatile corpus is fully kept in memory and thus all changes only affect the corresponding R object.