带有 R 的 topicmodels 包的 LDA,如何获得每个术语的主题概率?
LDA with topicmodels package for R, how do I get the topic probability for each term?
我正在使用 LDA 的 topicmodels 包。我想创建一个可视化来显示每个主题的相关或不相关程度。我设想了主题 1 独有的一组词,但有一些共享的关键字连接到另一个主题。这里的任何建议都会很棒。继续:
为此,我需要知道每个主题的每个术语概率。我如何使用 topicmodels 包获得它?我可以通过以下方式查看条款:
terms(LDAmodel, 15)
但我不知道如何获取值。想法?
您可以使用 posterior()$terms
来获得每一项的后验概率。 posterior()$topics
给出文档的概率。
示例改编自help(LDA)
:
data("AssociatedPress", package = "topicmodels")
lda <- LDA(AssociatedPress[1:20,], k = 2)
terms <- posterior(lda)$terms
## posterior probability for the first 5 terms (alphabetically)
terms[,1:5]
aaron abandon abandoned abandoning abbott
1 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
2 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
我正在使用 LDA 的 topicmodels 包。我想创建一个可视化来显示每个主题的相关或不相关程度。我设想了主题 1 独有的一组词,但有一些共享的关键字连接到另一个主题。这里的任何建议都会很棒。继续:
为此,我需要知道每个主题的每个术语概率。我如何使用 topicmodels 包获得它?我可以通过以下方式查看条款:
terms(LDAmodel, 15)
但我不知道如何获取值。想法?
您可以使用 posterior()$terms
来获得每一项的后验概率。 posterior()$topics
给出文档的概率。
示例改编自help(LDA)
:
data("AssociatedPress", package = "topicmodels")
lda <- LDA(AssociatedPress[1:20,], k = 2)
terms <- posterior(lda)$terms
## posterior probability for the first 5 terms (alphabetically)
terms[,1:5]
aaron abandon abandoned abandoning abbott
1 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
2 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44