如何在代理后使用gensim.downloader下载glove-wiki-gigaword-100或其他词向量包?
How to download glove-wiki-gigaword-100 or other word vector package using gensim.downloader behind a proxy?
通常我可以使用如下代码在jupyter lab中下载词向量包:
import gensim.downloader as api
word_vectors = api.load("glove-wiki-gigaword-50")
但是现在,我使用的是 windows 服务器,它有防火墙。所以这种方式已经行不通了。我也在 https://github.com/RaRe-Technologies/gensim-data:
上试过这个方法
python -m gensim.downloader --download glove-twitter-25
但是我不知道如何在这行设置代理。如果我的代理是http://my-proxy.com:80。那如何在防火墙后下载词向量呢?
我根本不会使用 gensim.downloader
设施,因为它引入了额外的 complexity/hidden-steps(包括 what I consider an unnecessary security risk 下载和 运行 额外 'shim' Python 正常 Gensim 版本中没有的代码)。
相反,找到你想要的普通数据集,将它下载到你能找到的地方,然后使用任何其他方法将文件传输到有防火墙的 Windows 服务器。
具体来说,50d GLoVe 向量似乎包含在规范 GLoVe 主页上提供的 glove.6B.zip
下载的一部分:
通常我可以使用如下代码在jupyter lab中下载词向量包:
import gensim.downloader as api
word_vectors = api.load("glove-wiki-gigaword-50")
但是现在,我使用的是 windows 服务器,它有防火墙。所以这种方式已经行不通了。我也在 https://github.com/RaRe-Technologies/gensim-data:
上试过这个方法python -m gensim.downloader --download glove-twitter-25
但是我不知道如何在这行设置代理。如果我的代理是http://my-proxy.com:80。那如何在防火墙后下载词向量呢?
我根本不会使用 gensim.downloader
设施,因为它引入了额外的 complexity/hidden-steps(包括 what I consider an unnecessary security risk 下载和 运行 额外 'shim' Python 正常 Gensim 版本中没有的代码)。
相反,找到你想要的普通数据集,将它下载到你能找到的地方,然后使用任何其他方法将文件传输到有防火墙的 Windows 服务器。
具体来说,50d GLoVe 向量似乎包含在规范 GLoVe 主页上提供的 glove.6B.zip
下载的一部分: