主题建模:两个主题之间差异最大的单词的图形表示
Topic Modeling: graphical representation of words with the greatest differences between two topics
在Text Mining with R中,介绍了对文档(例如博客文章或新闻文章)进行无监督分类的方法。这是主题建模的工作。我是运行这个link里面的代码,但是不知道怎么得到图6.3,"Words with the greatest difference in beta between topic 2 and topic 1".
有什么建议吗?
这本书有可用的源代码,您只需单击编辑按钮即可转到包含当前页面的 GitHub 项目进行编辑。只需导航到您需要的章节(Rmd 文件)并查找最接近图像的文本。
谢天谢地,这张图片也是用 R 制作的,所以你可以检查一下:here
为了完整性发帖:
beta_spread %>%
group_by(direction = log_ratio > 0) %>%
top_n(10, abs(log_ratio)) %>%
ungroup() %>%
mutate(term = reorder(term, log_ratio)) %>%
ggplot(aes(term, log_ratio)) +
geom_col() +
labs(y = "Log2 ratio of beta in topic 2 / topic 1") +
coord_flip()
在Text Mining with R中,介绍了对文档(例如博客文章或新闻文章)进行无监督分类的方法。这是主题建模的工作。我是运行这个link里面的代码,但是不知道怎么得到图6.3,"Words with the greatest difference in beta between topic 2 and topic 1".
有什么建议吗?
这本书有可用的源代码,您只需单击编辑按钮即可转到包含当前页面的 GitHub 项目进行编辑。只需导航到您需要的章节(Rmd 文件)并查找最接近图像的文本。
谢天谢地,这张图片也是用 R 制作的,所以你可以检查一下:here
为了完整性发帖:
beta_spread %>%
group_by(direction = log_ratio > 0) %>%
top_n(10, abs(log_ratio)) %>%
ungroup() %>%
mutate(term = reorder(term, log_ratio)) %>%
ggplot(aes(term, log_ratio)) +
geom_col() +
labs(y = "Log2 ratio of beta in topic 2 / topic 1") +
coord_flip()