NLTK 不会对大写单词进行词形还原
NLTK doesn't lemmatize uppercase words
我正在尝试将混合了大小写单词的字符串中的复数单词更改为单数单词。例如纸板箱,尺寸:19cm H x 10cm W x 30cm D
我使用 NLTK 包来这样做,但它只接受小写字符串,我不想将我的字符串中的所有单词都小写。有什么建议吗?
希望对您有所帮助:
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemma = []
for t in text.split():
if t.isupper():
t = lemmatizer.lemmatize(t.lower())
lemma.append(t.upper())
else:
lemma.append(t)
text = ' '.join(lemma)
我正在尝试将混合了大小写单词的字符串中的复数单词更改为单数单词。例如纸板箱,尺寸:19cm H x 10cm W x 30cm D
我使用 NLTK 包来这样做,但它只接受小写字符串,我不想将我的字符串中的所有单词都小写。有什么建议吗?
希望对您有所帮助:
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemma = []
for t in text.split():
if t.isupper():
t = lemmatizer.lemmatize(t.lower())
lemma.append(t.upper())
else:
lemma.append(t)
text = ' '.join(lemma)