Python 中的多语言词形还原

Multi language Lemmatization in Python

我有一个多语言的数据集。 我可以根据它的语言应用词形还原吗? 我已经根据它的语言分离了数据。 尝试使用 WordNet 词形还原,但它只支持英语[​​=11=]

对于多种语言的词干提取,我正在使用 snowballStemmer。

尝试使用 spacy 它支持超过 34 种语言,并且有词形还原器。