如何使用 LDA 获取主题建模的每个文档的主题概率
How to get the topic probability for each document for topic modeling using LDA
我使用 scikit-learn LDA
生成 LDA 模型,然后我可以获得主题词。我想知道如何获得每个文档的每个主题的概率?
使用LatentDirichletAllocation
class的transform
方法拟合模型。它将return文档主题分配。
如果您使用 example given in the documentation 用于 scikit-learn 的 Latent Dirichlet Allocation,则可以通过将以下行附加到代码来访问文档主题分布:
doc_topic_dist = lda.transform(tf)
这里,lda
是训练好的LDA模型,tf
是文档词矩阵。
我使用 scikit-learn LDA
生成 LDA 模型,然后我可以获得主题词。我想知道如何获得每个文档的每个主题的概率?
使用LatentDirichletAllocation
class的transform
方法拟合模型。它将return文档主题分配。
如果您使用 example given in the documentation 用于 scikit-learn 的 Latent Dirichlet Allocation,则可以通过将以下行附加到代码来访问文档主题分布:
doc_topic_dist = lda.transform(tf)
这里,lda
是训练好的LDA模型,tf
是文档词矩阵。