如何使用 LDA 获取主题建模的每个文档的主题概率

How to get the topic probability for each document for topic modeling using LDA

我使用 scikit-learn LDA 生成 LDA 模型,然后我可以获得主题词。我想知道如何获得每个文档的每个主题的概率?

使用LatentDirichletAllocationclass的transform方法拟合模型。它将return文档主题分配。

如果您使用 example given in the documentation 用于 scikit-learn 的 Latent Dirichlet Allocation,则可以通过将以下行附加到代码来访问文档主题分布:

doc_topic_dist = lda.transform(tf)

这里,lda是训练好的LDA模型,tf是文档词矩阵。