Java 中的 NP、VP 和 PP 短语分块 (CoreNLP)

Chunking NP, VP and PP phrases in Java (CoreNLP)

我正在使用 Stanford CoreNLP,我知道它不支持句子分块。我正在寻找的是,给定一个输入句子,输出这样的东西:

 [NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] . 

我也知道 OpenNLP 显然支持此功能,但我已经使用 CoreNLP 编写了很多代码,我不想切换。所以,我正在寻找的是一个可以为我做这件事的外部库,或者是关于以最简单的方式实现这个特性的想法(对出版物的引用、链接,一切都是受欢迎的),从解析树开始。我不需要它像最先进的分块器一样准确,至少现在是这样,所以我希望快速实现它,并可能在将来根据需要进行更改。

最后我发现 the Illinois chunker 正是我需要的。