主题建模:两个主题之间差异最大的单词的图形表示

Topic Modeling: graphical representation of words with the greatest differences between two topics

Text Mining with R中,介绍了对文档(例如博客文章或新闻文章)进行无监督分类的方法。这是主题建模的工作。我是运行这个link里面的代码,但是不知道怎么得到图6.3,"Words with the greatest difference in beta between topic 2 and topic 1".

有什么建议吗?

这本书有可用的源代码,您只需单击编辑按钮即可转到包含当前页面的 GitHub 项目进行编辑。只需导航到您需要的章节(Rmd 文件)并查找最接近图像的文本。

谢天谢地,这张图片也是用 R 制作的,所以你可以检查一下:here

为了完整性发帖:

beta_spread %>%
  group_by(direction = log_ratio > 0) %>%
  top_n(10, abs(log_ratio)) %>%
  ungroup() %>%
  mutate(term = reorder(term, log_ratio)) %>%
  ggplot(aes(term, log_ratio)) +
  geom_col() +
  labs(y = "Log2 ratio of beta in topic 2 / topic 1") +
  coord_flip()