MALLET主题推理

MALLET topic-inference

我正在尝试根据 MA​​LLET 训练的主题模型来推断文档的主题。我在木槌目录

中使用以下命令

./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs

但它卡在转换异常中:

java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer 我该如何解决这个问题?

模型和推理器之间存在差异。 train-topics 命令中的 --output-model FILENAME 选项生成一个文件(模型),其中包含训练数据以及所有推断参数。 --inferencer-filename FILENAME 生成一个小得多的文件(推理器),它只包含推断新文档主题所需的参数。

infer-topics 命令需要一个主题推理器,而不是一个完整的模型。您可以通过 运行 train-topics 使用 --input-model FILENAME--inferencer-filename FILENAME 选项以及 --num-iterations 0.

从现有模型文件创建推理器