如何将列表转换为 r 中的语料库?
How transform a list into a corpus in r?
在这个 中,我询问了如何拆分一个巨大的数据框来创建一个语料库。多亏了答案,我才能够从数据框中创建一个列表。
我的问题仍然是 从我创建的列表中获取语料库 以便进行一些文本挖掘并根据搜索词对数据进行聚类。
为了解决这个问题,我只是将 tm 包的 as.VCorpus 功能应用到我之前创建的列表中:
new_corpus <- as.VCorpus(new_list)
检查新对象是否是语料库:
class(new_corpus)
[1] "VCorpus" "Corpus"
我就这样创建了一个"volatile corpus"。如 R 文档中所写:
A volatile corpus is fully kept in memory and thus all changes only affect the corresponding R object.
在这个
为了解决这个问题,我只是将 tm 包的 as.VCorpus 功能应用到我之前创建的列表中:
new_corpus <- as.VCorpus(new_list)
检查新对象是否是语料库:
class(new_corpus)
[1] "VCorpus" "Corpus"
我就这样创建了一个"volatile corpus"。如 R 文档中所写:
A volatile corpus is fully kept in memory and thus all changes only affect the corresponding R object.