如何从 bin 文件中获取 vec 文件?
How can I get a vec file from a bin file?
我正在尝试使我的模型与 fasttext unsupervised.py
https://github.com/facebookresearch/MUSE 保持一致。我用 fasttext
训练了我的模型,我得到了二进制文件 model.bin
。当我使用 unsupervised.py 我得到
error: ValueError: model.bin has wrong file format
怎么了?我必须要有 .vec
文件吗?如何获得?
关于.bin 和.vec 文件的区别,您可以阅读这篇。
无论如何,MUSE 需要 .vec 文件。
如果您想将 .bin 文件转换为 .vec 文件,this answer 可能会帮助您。
Puthon Gensim 包可以加载 Facebook FastText .bin
模型及其 FastText.load_facebook_model()
method:
ft_model = FastText.load_facebook_model(path_to_bin)
然后,使用 KeyedVectors' method
.save_word2vec_format()with the
binary=False` option:
仅将模型包含的 .wv
词向量中的向量保存为纯文本 .vec
文件
ft_model.wv.save_word2vec_format('ft_model.vec')
我正在尝试使我的模型与 fasttext unsupervised.py
https://github.com/facebookresearch/MUSE 保持一致。我用 fasttext
训练了我的模型,我得到了二进制文件 model.bin
。当我使用 unsupervised.py 我得到
error: ValueError: model.bin has wrong file format
怎么了?我必须要有 .vec
文件吗?如何获得?
关于.bin 和.vec 文件的区别,您可以阅读这篇
无论如何,MUSE 需要 .vec 文件。
如果您想将 .bin 文件转换为 .vec 文件,this answer 可能会帮助您。
Puthon Gensim 包可以加载 Facebook FastText .bin
模型及其 FastText.load_facebook_model()
method:
ft_model = FastText.load_facebook_model(path_to_bin)
然后,使用 KeyedVectors' method
.save_word2vec_format()with the
binary=False` option:
.wv
词向量中的向量保存为纯文本 .vec
文件
ft_model.wv.save_word2vec_format('ft_model.vec')