python: 修改nltk中的PerceptronTagger来识别'and/or'

python: modify PerceptronTagger in nltk to recognize 'and/or'

我如何修改 nltk 模块中的 PerceptronTagger(或者可能向其添加一些临时功能)以便它将 'and/or' 识别为 'CC' 标签?

如果这是您想要更改的唯一内容,最简单的解决方案是 post- 处理标记的文本:

for sentence in tagged_sentences:
    for n, (word,tag) in enumerate(sentence):
        if word == 'and/or':
            sentence[n] = (word, "CC")

但如果您的问题是 "improving" NLTK 标注器的第一步,您应该放眼长远,考虑如何构建或安装更好的标注器。查看 .

中包含的许多链接