在 Galago 搜索引擎中使用 LDA

Using LDA in Galago search engine

我已经开始使用 Galago 进行文档检索。我想使用 LDA 对一些文档(最初检索到的任何模型的文档)进行聚类。我更喜欢使用基于 java 的实现,它可以使用 Galago 集成到我的代码中。如果您能让我知道哪种 LDA 开源实现更适合我的目的,我将不胜感激。

提前感谢您的帮助!

这篇论文中有一个 LDA 的快速算法:

S. Arora, R. Ge, Y. Halpern, D. Mimno, A. Moitra, D. Sontag, Y. Wu, M. Zhu. A Practical Algorithm for Topic Modeling with Provable Guarantees. 30th International Conference on Machine Learning (ICML), 2013.

其中一位作者 (D. Mimno) 在 github 上有一个 Java 实现:https://github.com/mimno/anchor

我简要地研究了这个实现,发现了又好又快的结果。与所有 LDA/Topic 建模一样,获得正确的主题数量可能具有挑战性。