是否可以在 deeplearning4j.word2vec 中使用 gensim word2vec 模型?

Is it possible to use gensim word2vec model in deeplearning4j.word2vec?

我是 deeplearning4j 的新手,我想使用词向量作为分类器的输入来制作句子分类器。 我之前使用 python,其中矢量模型是使用 gensim 生成的,我想将该模型用于这个新的分类器。 是否可以在 deeplearning4j.word2vec 中使用 gensim 的 word2vec 模型,我该怎么做?

是的,这是可能的,因为 Word2Vec 实现定义了构建其模型的标准。

为此:

  1. 使用gensim,保存模型兼容Word2Vec实现:

    w2v_model.wv.save_word2vec_format("path/to/w2v_model.bin", binary=True)
    
  2. 来自DL4J,加载相同的预训练模型:

    Word2Vec w2vModel = WordVectorSerializer.readWord2VecModel("path/to/w2v_model.bin");
    

事实上,您可以在两种代码中测试模型,您应该会看到相同的结果,例如:

使用gensim:

print(w2v_model.most_similar("love"))
print(w2v_model.n_similarity(["man"], ["king"]))

和 DL4J:

System.out.println(w2vModel.wordsNearest("love", 10));
System.out.println(w2vModel.similarity("man", "king"));