Gensim:正在使用 gensim.models.doc2vec 的慢速版本

Gensim: Slow version of gensim.models.doc2vec is being used

我的设置如下:

Python版本:3.6.0

Numpy 版本:1.13.0

Scipy版本:0.19.0

Gensim 版本:2.1.0

GCC 编译器版本:5.3.0

系统:Windows7、64位

上面的设置出现以下错误

import gensim
>>>Slow version of gensim.models.doc2vec is being used

这使得在 gensim 上训练模型时 运行 时间太慢了。我觉得我正在使用的软件包版本或安装方式存在一些问题,因为:我必须使用 pip 安装 numpy;我必须使用 conda 安装 scipy;我不得不再次使用 pip 安装 gensim。此设置的原因是,如果我尝试使用 pip 安装 scipy,我会收到错误消息

>>>ImportError: DLL load failed: The specified procedure could not be found.

所以我不得不通过 conda 安装 scipy。另外,如果我尝试使用

安装 gensim

conda install gensim

conda update gensim

它只安装版本 1 - 我试过 conda install -c anaconda gensim=2.1.0 但我收到错误

PackageNotFoundError: Package missing in current win-64 channels:
- gensim 2.1.0*
当我将

Numpy 和 Scipy 导入脚本时,它们可以独立工作 - 也就是说,它们可以正常导入,我可以使用它们的所有功能。但是在Gensim使用的时候,明显有问题,不知道是什么原因。

任何人都可以建议可能的修复方法吗?理想情况下,如果可能的话,我想保留这些软件包的所有最新版本。提前谢谢你

注意:当我安装了 Gensim 版本 1 并且具有相同版本的上述依赖项时,Gensim 可以与 "fast" 版本一起正常工作!

问题是一些底层包不是最新的。 Here 我找到了适合我的答案,简而言之:

卸载 Gensim

sudo pip3 uninstall gensim

安装python3-dev build-essential

sudo apt-get install python3-dev build-essential  

重新安装 Gensim

sudo pip3 install --upgrade gensim

备注:

以上说明适用于使用 pip 和 apt-get 管理包的系统
pip3 是 pip

的 python3 版本

我也有这个问题(我是运行宁ubuntu)。 我发现如果我直接使用 github 的版本,问题就解决了。

所以有2个解决方案:(首先使用pip uninstall gensim卸载gensim)

  • 从gensim的github page下载gensim zip文件并解压,然后CD到zip内容的文件夹和运行命令 python setup.py install
  • 运行 这个命令 pip install git+https://github.com/RaRe-Technologies/gensim@master#egg=gensim

我使用了第二个,现在我没有收到警告