短文本主题建模 Python

Topic modeling on short texts Python

我想对短文本进行主题建模。我对 LDA 做了一些研究,发现它不适用于短文本。什么方法会更好,它们有 Python 实现吗?

您可以试试短文本主题建模(参考这篇https://www.groundai.com/project/sttm-a-tool-for-short-text-topic-modeling/1) (code available at https://github.com/qiang2100/STTM)。它结合了最先进的算法和传统的长文本主题建模,可以方便地用于短文本。

对于更专业的库,请尝试 lda2vec-tf,它结合了词向量和 LDA 主题向量。它是从原始的 lda2vec 分支出来的,并进行了改进并提供了比原始库更好的结果。

短文本主题建模的唯一 Python 实现是 GSDMM。不幸的是,其他大多数都写在Java。

此外 GSDM, there is also biterm 在 python 中实现了短文本主题建模。