spaCy 词形还原(通过 .lemma_)仅返回空字符串
spaCy lemmatization (via .lemma_) is returning only empty strings
我无法使 spaCy 词形还原工作,它总是 returns 空字符串。
import spacy
from spacy.lang.en import English
nlp = English()
text = "I went to the bank today for checking my bank balance."
doc = nlp(text)
这个returns只是空字符串:
for token in doc:
print(token.lemma_)
系统信息:
Windows 10 Pro 64bits
Python 3.8.8
spacy 3.0.6
spacy-legacy 3.0.5
我是不是做错了什么?感谢任何意见。
引理数据非常大,因此它不包含在核心 spaCy 安装中。您需要安装英文模型或查找数据。您可以这样下载小模型:
spacy download en_core_web_sm
然后加载模型。
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp("cheeses")
print(doc[0].lemma_) # "cheese"
应该可以了。
我无法使 spaCy 词形还原工作,它总是 returns 空字符串。
import spacy
from spacy.lang.en import English
nlp = English()
text = "I went to the bank today for checking my bank balance."
doc = nlp(text)
这个returns只是空字符串:
for token in doc:
print(token.lemma_)
系统信息:
Windows 10 Pro 64bits
Python 3.8.8
spacy 3.0.6
spacy-legacy 3.0.5
我是不是做错了什么?感谢任何意见。
引理数据非常大,因此它不包含在核心 spaCy 安装中。您需要安装英文模型或查找数据。您可以这样下载小模型:
spacy download en_core_web_sm
然后加载模型。
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp("cheeses")
print(doc[0].lemma_) # "cheese"
应该可以了。