MALLET主题推理
MALLET topic-inference
我正在尝试根据 MALLET 训练的主题模型来推断文档的主题。我在木槌目录
中使用以下命令
./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs
但它卡在转换异常中:
java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer
我该如何解决这个问题?
模型和推理器之间存在差异。 train-topics
命令中的 --output-model FILENAME
选项生成一个文件(模型),其中包含训练数据以及所有推断参数。 --inferencer-filename FILENAME
生成一个小得多的文件(推理器),它只包含推断新文档主题所需的参数。
infer-topics
命令需要一个主题推理器,而不是一个完整的模型。您可以通过 运行 train-topics
使用 --input-model FILENAME
和 --inferencer-filename FILENAME
选项以及 --num-iterations 0
.
从现有模型文件创建推理器
我正在尝试根据 MALLET 训练的主题模型来推断文档的主题。我在木槌目录
中使用以下命令./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs
但它卡在转换异常中:
java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer
我该如何解决这个问题?
模型和推理器之间存在差异。 train-topics
命令中的 --output-model FILENAME
选项生成一个文件(模型),其中包含训练数据以及所有推断参数。 --inferencer-filename FILENAME
生成一个小得多的文件(推理器),它只包含推断新文档主题所需的参数。
infer-topics
命令需要一个主题推理器,而不是一个完整的模型。您可以通过 运行 train-topics
使用 --input-model FILENAME
和 --inferencer-filename FILENAME
选项以及 --num-iterations 0
.