如何使用经过训练的 GloVe/word2vec 模型从文章中提取关键词?

How can I use a trained GloVe/word2vec model to extract keywords from articles?

我用 ~5M spanish 篇文章训练了 GloVe。我知道如何在 gensim 中加载这个 GloVe 并将其用作 word2vec 模型。 现在我面临着从新闻文章(也是西班牙语)中提取主题建模和关键字的问题,所以我想知道如何使用经过训练的模型来做到这一点。

我该怎么做?

您关于如何使用 word2vec 模型的问题非常笼统,所以我的回答也是如此。

word2vec 允许您做的是提供一般的 "better" 单词表示。因此,如果您在主题建模中使用 "bag of words" 作为特征,您可以将其替换为来自 word2vec 的 "bag of word vectors",这有望为您提供更好的语义相似性。也许还有更好的关键字。