在gensim LdaModel中提取主题词概率矩阵

Extract topic word probability matrix in gensim LdaModel

我有 LDA 模型和文档主题概率。

# build the model on the corpus
ldam = LdaModel(corpus=corpus, num_topics=20, id2word=dictionary) 
# get the document-topic probabilities
theta, _ = ldam.inference(corpus)

我还需要所有主题的词分布,即主题词概率矩阵。有没有办法提取这些信息?

谢谢!

topics-term 矩阵 (lambda) 可通过以下方式访问:

topics_terms = ldam.state.get_lambda()

如果您想要概率分布,只需对其进行归一化即可:

topics_terms_proba = np.apply_along_axis(lambda x: x/x.sum(),1,topics_terms)