python: 修改nltk中的PerceptronTagger来识别'and/or'
python: modify PerceptronTagger in nltk to recognize 'and/or'
我如何修改 nltk
模块中的 PerceptronTagger
(或者可能向其添加一些临时功能)以便它将 'and/or' 识别为 'CC' 标签?
如果这是您想要更改的唯一内容,最简单的解决方案是 post- 处理标记的文本:
for sentence in tagged_sentences:
for n, (word,tag) in enumerate(sentence):
if word == 'and/or':
sentence[n] = (word, "CC")
但如果您的问题是 "improving" NLTK 标注器的第一步,您应该放眼长远,考虑如何构建或安装更好的标注器。查看 .
中包含的许多链接
我如何修改 nltk
模块中的 PerceptronTagger
(或者可能向其添加一些临时功能)以便它将 'and/or' 识别为 'CC' 标签?
如果这是您想要更改的唯一内容,最简单的解决方案是 post- 处理标记的文本:
for sentence in tagged_sentences:
for n, (word,tag) in enumerate(sentence):
if word == 'and/or':
sentence[n] = (word, "CC")
但如果您的问题是 "improving" NLTK 标注器的第一步,您应该放眼长远,考虑如何构建或安装更好的标注器。查看