ImportError: No module named 'spacy.en'

ImportError: No module named 'spacy.en'

我正在开发一个使用 Spacy 的代码库。我安装 spacy 使用:

sudo pip3 install spacy

然后是

sudo python3 -m spacy download en

在最后一条命令结束时,我收到一条消息:

    Linking successful
/home/rayabhik/.local/lib/python3.5/site-packages/en_core_web_sm -->
/home/rayabhik/.local/lib/python3.5/site-packages/spacy/data/en

You can now load the model via spacy.load('en')

现在,当我尝试 运行 我的代码时,行:

    from spacy.en import English

它给我以下错误:

ImportError: No module named 'spacy.en'

我查看了 Stackexchange,最接近的是: 这不能解决我的问题。

如有任何帮助,我们将不胜感激。谢谢。

编辑:我可能已经通过执行以下操作解决了这个问题:

 Python 3.5.2 (default, Sep 14 2017, 22:51:06) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import spacy
>>> spacy.load('en')
<spacy.lang.en.English object at 0x7ff414e1e0b8>

然后使用:

from spacy.lang.en import English

我仍然保持打开状态,以防有任何其他答案。

是的,我可以确认您的解决方案是正确的。你从pip下载的spaCy版本是v2.0,包含了很多新特性,还a few changes to the API。其中之一是所有语言数据都已移至子模块 spacy.lang 以保持内容更清晰、更有条理。因此,您现在不再使用 spacy.en,而是从 spacy.lang.en.

导入
- from spacy.en import English
+ from spacy.lang.en import English

但是,还值得一提的是,您在 运行 spacy download en 时下载的内容与 spacy.lang.en 不同。 spaCy 附带的语言数据包括静态数据,如分词规则、停用词或词形还原表。您可以下载的 en 包是统计模型 en_core_web_sm 的快捷方式。它包括语言数据,以及使 spaCy 能够预测词性标签、依赖项和命名实体的二进制权重。

与其只下载 en,我实际上建议使用完整的型号名称,这样可以更清楚地了解正在发生的事情:

python -m spacy download en_core_web_sm
nlp = spacy.load("en_core_web_sm")

当您调用 spacy.load 时,spaCy 会执行以下操作:

  1. 找到名为 "en_core_web_sm" 的已安装模型(包或快捷方式 link)。
  2. 阅读它的 meta.json 并检查它使用的是哪种语言(在这种情况下,spacy.lang.en),以及它的处理管道应该是什么样子(在这种情况下,taggerparserner).
  3. 初始化语言 class 并向其添加管道。
  4. 从模型数据中加载二进制权重,以便管道组件(如标记器、解析器或实体识别器)可以进行预测。

有关详细信息,请参阅 this section in the docs

我不得不使用 en_core_web_sm 而不是 en 来完成这项工作。它抱怨权限问题。以下完美运行:

import spacy
spacy.load('en_core_web_sm')
from spacy.lang.en import English

en_core_web_sm 文件夹已下载到 spacy 文件夹之外。我将它复制到 spacy/data 文件夹中,并且可以 运行 spacy

中记录的代码

我使用以下命令从 anaconda 发行版安装 spacy。

conda install -c conda-forge spacy

之后,我可以使用以下命令毫无错误地下载英文。

 python -m spacy download en

我认为所提供的答案存在混淆。 更正提到的事情:

  • 你应该从 spacy.lang.en
  • 导入
  • spacy.load('en')确实是加载模型的捷径

但是: 文件 en_core_web_sm 与您从 spacy.lang.en 导入的文件不同。实际上,第一个文件是在数据集中使用 spacy train 训练后从第二个文件生成的,然后将结果打包。 spacy.lang.en 包含模型定义:词条查找 table、stop_words、词法属性(以及更多)。但仅此而已。它没有使用数据集进行训练,因此依赖图和其他功能可以正常工作。

我认为在使用 spaCy 时这应该足够清楚了。

在安装 Windows 10 和 Anaconda 时遇到此问题的任何人,请在 运行 安装脚本之前在命令行上使用 where python 查找您的 conda python 可执行文件。

在我的例子中,PATH 上的 python 是

C:\Users\XXX\.windows-build-tools\python27\python.exe

而我需要的是

c:\Users\XXX\AppData\Local\Continuum\anaconda3\python.exe

只需在路径上添加正确的 python,或者转到此位置并 运行

python -m spacy download en

它应该可以工作。

根据官方网站,你应该做如下:

python -m spacy download en

然而,令人惊讶的是这对我不起作用。
您可能会感兴趣,我的环境基于 OSX 10.15 和 python 3.8,pip 19.3.1
尝试:

spacy download en

从spacy.lang.en导入英语 代替 来自 spacy.en 导入英语

对我来说,这些步骤有效:

import sys
!{sys.executable} -m pip install spacy
!{sys.executable} -m spacy download en

我在我的 spyder 控制台(通过 anaconda 安装)运行 这些步骤

Anaconda 用户

  1. 如果您使用的是 conda 虚拟环境,请确保它的 Python 版本与您的基础环境中的版本相同。为了验证这一点,每个环境中的 运行 python --version。如果不相同,请使用该版本的 Python(例如 conda create --name myenv python=x.x.x)创建一个新的虚拟环境。

  2. 激活虚拟环境(conda activate myenv)

  3. conda install -c conda-forge spacy
  4. python -m spacy download en_core_web_sm

我刚刚 运行 解决了这个问题,上面的内容对我有用。这解决了在当前虚拟环境无法访问的区域进行下载的问题。

然后您应该能够运行以下内容:

import spacy
nlp = spacy.load("en_core_web_sm")

我对 en 和 fr 的解决方案

!pip install spacy
!python -m spacy download en
!python -m spacy download it
!python -m spacy download fr

然后

import spacy
spacy.load('en')
spacy.load('it')
spacy.load('fr')
pip install spacy
python -m spacy download en

这对我有用

对我来说,以下步骤在我的 Jupyter 中有效:

pip install spacy


import spacy

from spacy.cli import download

print(download('en_core_web_sm'))