如何使用预训练的词向量创建 gensim word2vec 模型?
How to create gensim word2vec model using pre trained word vectors?
我使用分布式 word2vec 算法创建了词向量。现在我有了单词和它们对应的向量。如何使用这些词和向量构建 gensim word2vec 模型?
我不确定您是否使用 gensim
或其他一些工具创建了 word2vec 模型,但如果正确理解您的问题,您只想使用 gensim 加载 word2vec 模型。这是通过以下方式完成的:
import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed
但是,如果您想做的是纯粹使用 gensim
从头开始(即从原始文本)训练 word2vec 模型,这里是 tutorial on how to train word2vec model using gensim.
我使用分布式 word2vec 算法创建了词向量。现在我有了单词和它们对应的向量。如何使用这些词和向量构建 gensim word2vec 模型?
我不确定您是否使用 gensim
或其他一些工具创建了 word2vec 模型,但如果正确理解您的问题,您只想使用 gensim 加载 word2vec 模型。这是通过以下方式完成的:
import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed
但是,如果您想做的是纯粹使用 gensim
从头开始(即从原始文本)训练 word2vec 模型,这里是 tutorial on how to train word2vec model using gensim.