OSError: [E050] Can't find model 'de'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory

OSError: [E050] Can't find model 'de'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory

所以我正在尝试使用 pytorch 在在线笔记本(如 kaggle 笔记本和 google colab

上使用 pytorch 制作一个 seq 到 seq 模型,将德语翻译成英语
import torch
import torch.nn as nn
import torch.optim as optim
from torchtext.datasets import Multi30k
from torchtext.data import Field, BucketIterator
import numpy as np
import spacy
import random
from torch.utils.tensorboard import SummaryWriter  # to print to tensorboard

导入的库,当我使用带有spacy的函数加载数据集时,如下所示,

spacy_ger = spacy.load("de")
spacy_eng = spacy.load("en")

出现这个错误: OSError:[E050] 找不到型号 'de'。它似乎不是快捷方式 link、Python 包或数据目录的有效路径。

到处都是'en'的解释,'de'却没有。如果有人可以提供帮助。

规格:

包:版本

在此先感谢您的帮助。

所以在整整一个月后,尝试其他事情并探索与该主题相关的问题和问题,我找到了一种方法,

  import spacy.cli 
  spacy.cli.download("en_core_web_md")

使用此方法,您可以使用和导入任何 spacy 模型,无论是 medium-sized 还是更大尺寸的数据集,如果您尝试使用 spacy.load 因为它对于在 Google colab 或 Kaggle 笔记本或任何其他在线笔记本中加载 sm 或最小尺寸数据集以外的数据集无效。

接受的答案对我不起作用,而且问题是德语,而不是英语。

因此您需要下载 de 个文件:

运行终端下面的

python -m spacy download de

下载完成后,您应该可以正常使用spacy.load("de")

如果您使用的是英文,则只需使用以下方式下载英文文件:

python -m spacy download en