俄语单词列表的 SnowballStemmer
SnowballStemmer for Russian words list
我确实知道如何对单个单词执行 SnowballStemmer(在我的例子中,是俄语单词)。做接下来的事情:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("russian")
stemmer.stem("Василий")
'Васил'
如果我有一个单词列表,如 ['Василий', 'Γеннадий', 'Виталий'],我该如何执行以下操作?
我使用 for 循环的方法似乎不起作用:(
l=[stemmer.stem(word) for word in l]
你的变量l
没有预定义,导致名称错误。请参阅我的最后两行以进行修复。
>>> from nltk.stem.snowball import SnowballStemmer
>>> stemmer = SnowballStemmer("russian")
>>> my_words = ['Василий', 'Геннадий', 'Виталий']
>>> l=[stemmer.stem(word) for word in l]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'l' is not defined
>>> l=[stemmer.stem(word) for word in my_words]
>>> l
['васил', 'геннад', 'витал']
我确实知道如何对单个单词执行 SnowballStemmer(在我的例子中,是俄语单词)。做接下来的事情:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("russian")
stemmer.stem("Василий")
'Васил'
如果我有一个单词列表,如 ['Василий', 'Γеннадий', 'Виталий'],我该如何执行以下操作?
我使用 for 循环的方法似乎不起作用:(
l=[stemmer.stem(word) for word in l]
你的变量l
没有预定义,导致名称错误。请参阅我的最后两行以进行修复。
>>> from nltk.stem.snowball import SnowballStemmer
>>> stemmer = SnowballStemmer("russian")
>>> my_words = ['Василий', 'Геннадий', 'Виталий']
>>> l=[stemmer.stem(word) for word in l]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'l' is not defined
>>> l=[stemmer.stem(word) for word in my_words]
>>> l
['васил', 'геннад', 'витал']