我可以使用哪些工具来查找词性模式

What tools can I use to find Part Of Speech Patterns

我正在寻找用于在文档语料库中查找词性模式的工具。我正在使用 Stanford NLP 工具对我的文档进行 POS 标记。现在我想查询这些标记的文档并找到一些特定的 POS 模式,例如

NPJJ(例如:电影很好看)

JJNP(例如:优质鹅肝)

有没有一种工具可以简单高效地为我完成这项工作,还是我需要自己编写?

要考虑的一个工具是语料库Workbench:http://cwb.sourceforge.net/

来自 Stanford CoreNLP,您还可以使用 TokensRegex 来匹配标记列表中的模式:http://nlp.stanford.edu/software/tokensregex.shtml

例如,您的两个模式如下:

[{tag:NN}] [{word:is}] [{tag:JJ}]

[{tag:JJ}] [{tag:NN}]

(旁注,但 NP 不是 POS 标签。可能,真的,你想要的是 [{tag:/N.*/}] 和 [{lemma:be}] 来捕捉更广泛的例)。