Gensim Word2Vec 或 FastText 从频率构建词汇

Gensim Word2Vec or FastText build vocab from frequency

我想知道 gensim 中的 .build_vocab_from_freq() 函数到底有什么作用?当我不使用它时有什么区别?谢谢!

它"builds a vocabulary from a dictionary of word frequencies"。你的 gensim 模型需要一个词汇表。通常你从你的语料库构建它。这基本上是从词频词典构建词汇表的另一种选择。例如,词频通常用于过滤对您的模型无意义的低频或高频词。