在 nltk 中查找词干 python

Finding Word Stems in nltk python

nltk

！ http://pik.vn/2015c740128e-11bc-40b0-8354-7fa58579d1d1.png

-我不知道上面的 [0] 它是如何工作的

你的问题很模糊，如果你能称之为问题的话。但是，如果您将 [0] 放在 re.findall 之后并放入一些打印语句，您将看到 re.findall returns 一个列表。 re.findall 之后的“[0]”是该列表的第一项。

此外；在这种情况下，我不确定 re.findall 你想要什么，因为你的正则表达式指定匹配应该被'^'和'$'包围，所以可能不会超过一个匹配，如果有的话。我假设您当时正在为词干函数提供单个单词，在这种情况下 ^ 和 $ 是多余的。最后;这种类型的词干提取可以非常快速和有效，但显然它非常初级：考虑 "bus, blues, thing, lament" 会发生什么，仅举几例。