spaCy 词形还原(通过 .lemma_)仅返回空字符串

spaCy lemmatization (via .lemma_) is returning only empty strings

我无法使 spaCy 词形还原工作,它总是 returns 空字符串。

import spacy  
from spacy.lang.en import English

nlp = English()  
text = "I went to the bank today for checking my bank balance."  
doc = nlp(text)   

这个returns只是空字符串:

for token in doc:  
    print(token.lemma_)

系统信息:

Windows 10 Pro 64bits
Python 3.8.8
spacy                         3.0.6
spacy-legacy                  3.0.5

我是不是做错了什么?感谢任何意见。

引理数据非常大,因此它不包含在核心 spaCy 安装中。您需要安装英文模型或查找数据。您可以这样下载小模型:

spacy download en_core_web_sm

然后加载模型。

import spacy
nlp = spacy.load("en_core_web_sm")

doc = nlp("cheeses")
print(doc[0].lemma_) # "cheese"

应该可以了。