NLTK 词性缩写参考
Abbreviation Reference for NLTK Parts of Speech
我正在使用 nltk 查找句子中每个单词的词性。它 returns 我既不能完全凭直觉又找不到好的文档的缩写。
运行:
import nltk
sample = "There is no spoon."
tokenized_words = nltk.word_tokenize(sample)
tagged_words = nltk.pos_tag(tokenized_words)
print tagged_words
Returns:
[('There', 'EX'), ('is', 'VBZ'), ('no', 'DT'), ('spoon', 'NN'), ('.', '.')]
在上面的示例中,我正在寻找 DT
、EX
和其余的意思。
到目前为止,我最好的办法是在 Natural Language Processing with Python 中搜索有关缩写词的提及,但必须有更好的东西。我确实也找到了一些基于文献的资源,但我不知道如何判断使用的是哪个nltk。
您已经提到的 link 有两个不同的标签集。
For tagset documentation, see nltk.help.upenn_tagset()
and nltk.help.brown_tagset()
.
在此特定示例中,这些标签来自 Penn Treebank tagset。
您还可以通过以下方式了解这些标签:
nltk.help.upenn_tagset('DT')
nltk.help.upenn_tagset('EX')
我正在使用 nltk 查找句子中每个单词的词性。它 returns 我既不能完全凭直觉又找不到好的文档的缩写。
运行:
import nltk
sample = "There is no spoon."
tokenized_words = nltk.word_tokenize(sample)
tagged_words = nltk.pos_tag(tokenized_words)
print tagged_words
Returns:
[('There', 'EX'), ('is', 'VBZ'), ('no', 'DT'), ('spoon', 'NN'), ('.', '.')]
在上面的示例中,我正在寻找 DT
、EX
和其余的意思。
到目前为止,我最好的办法是在 Natural Language Processing with Python 中搜索有关缩写词的提及,但必须有更好的东西。我确实也找到了一些基于文献的资源,但我不知道如何判断使用的是哪个nltk。
您已经提到的 link 有两个不同的标签集。
For tagset documentation, see
nltk.help.upenn_tagset()
andnltk.help.brown_tagset()
.
在此特定示例中,这些标签来自 Penn Treebank tagset。
您还可以通过以下方式了解这些标签:
nltk.help.upenn_tagset('DT')
nltk.help.upenn_tagset('EX')