使用 Python NLTK 对英语和俄语进行词干提取和词形还原

Stemming and Lemmatization with Python NLTK for both language as English and Russia

"Stemming and Lemmatization with Python NLTK for both language as English and Russia"

来源:http://text-processing.com/demo/stem/

我想用 Python NLTK 来提取英语和俄语两种语言的库。

你能给我建议这个任务需要使用哪个库吗?

对于词干提取:

NLTK 有 Porter Stemmer 被广泛使用。

对于俄语,好像有人用过

词形还原:

我更喜欢SpaCy for lemmatization

对于俄语,有人一直在研究这个here

可以找到另一个用于俄语文本的词形还原器 here.