在 nltk 中查找词干 python

Finding Word Stems in nltk python

http://pik.vn/2015c740128e-11bc-40b0-8354-7fa58579d1d1.png

-我不知道上面的 [0] 它是如何工作的

你的问题很模糊,如果你能称之为问题的话。 但是,如果您将 [0] 放在 re.findall 之后并放入一些打印语句,您将看到 re.findall returns 一个列表。 re.findall 之后的“[0]”是该列表的第一项。

此外;在这种情况下,我不确定 re.findall 你想要什么,因为你的正则表达式指定匹配应该被'^'和'$'包围,所以可能不会超过一个匹配,如果有的话。我假设您当时正在为词干函数提供单个单词,在这种情况下 ^ 和 $ 是多余的。 最后;这种类型的词干提取可以非常快速和有效,但显然它非常初级:考虑 "bus, blues, thing, lament" 会发生什么,仅举几例。