通过 corpora.csvcorpus 在 gensim LDA 中输入 CSV

CSV Input in gensim LDA via corpora.csvcorpus

我想在 gensim 中使用 LDA 对几千个文档进行主题建模。 因此,我使用 csv 文件作为术语文档矩阵格式的输入。

目前运行以下代码时出现错误:

from gensim import corpora

import_path ="TDM.csv"

dictionary = corpora.csvcorpus(import_path, labels='true')

错误如下:

dictionary = corpora.csvcorpus(import_path, labels='true')

AttributeError: module 'gensim.corpora' has no attribute 'csvcorpus'

我是否正确使用了该模块?如果是,我的错误在哪里?

提前致谢。

这也困扰了我一段时间。 看起来 csvcorpus 实际上处于实验阶段,您可以在他们的 github 问题 https://github.com/RaRe-Technologies/gensim/issues/1583

中看到

我建议您改用老式的方法,即使用 csv 包来读取您的 csv 文件。

干杯。