使用 gensim 进行主题建模

Topic Modelling using gensim

我正在制作短信分类器。为此,我想将我的消息分类为不同的主题。所以我想为此使用 gensim。 任何人都可以向我提供任何可以帮助我开始使用 gensim 进行主题建模的教程的来源吗?

gensim 的作者 Radim Řehůřek 在他的网站上提供了教程,我觉得很有帮助:https://radimrehurek.com/gensim/tutorial.html

他还提供了一些关于他的 github 的教程,这些教程并不那么容易找到,因此在其中挖掘一段时间可能会发现一些很棒的笔记本。 例如,这两个(对于 LDA): https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/lda_training_tips.ipynb

https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/topic_methods.ipynb

我个人觉得从英文维基百科入手非常令人兴奋,Řehůřek 还为此提供了教程。尽管训练模型需要相当长的时间,但您会发现自己拥有非常 "natural" 的主题,这使得测试 gensim 的功能变得容易。