基于单词的战斗和词形还原

based word for battling and lemmatization

全部,

战斗的基本形式是什么?词形还原导致 battling,而我认为应该是 battle。我对词形还原的理解有误吗?

from nltk import download
download('wordnet')
from nltk.stem.wordnet import WordNetLemmatizer

lemmatizer = WordNetLemmatizer()

def get_lemma(word):
    return lemmatizer.lemmatize(word)

get_lemma('battling')

coming

这个词也一样

默认词形还原 pos(词性)是 lemmatize 方法的名词。它产生输出 battling.

如果您将 pos 更改为动词,就像这里的情况一样,您会得到正确的结果。

lemmatizer.lemmatize("battling", wordnet.VERB)

会给基数battle