Java 中的 NP、VP 和 PP 短语分块 (CoreNLP)
Chunking NP, VP and PP phrases in Java (CoreNLP)
我正在使用 Stanford CoreNLP,我知道它不支持句子分块。我正在寻找的是,给定一个输入句子,输出这样的东西:
[NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] .
我也知道 OpenNLP 显然支持此功能,但我已经使用 CoreNLP 编写了很多代码,我不想切换。所以,我正在寻找的是一个可以为我做这件事的外部库,或者是关于以最简单的方式实现这个特性的想法(对出版物的引用、链接,一切都是受欢迎的),从解析树开始。我不需要它像最先进的分块器一样准确,至少现在是这样,所以我希望快速实现它,并可能在将来根据需要进行更改。
最后我发现 the Illinois chunker 正是我需要的。
我正在使用 Stanford CoreNLP,我知道它不支持句子分块。我正在寻找的是,给定一个输入句子,输出这样的东西:
[NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] .
我也知道 OpenNLP 显然支持此功能,但我已经使用 CoreNLP 编写了很多代码,我不想切换。所以,我正在寻找的是一个可以为我做这件事的外部库,或者是关于以最简单的方式实现这个特性的想法(对出版物的引用、链接,一切都是受欢迎的),从解析树开始。我不需要它像最先进的分块器一样准确,至少现在是这样,所以我希望快速实现它,并可能在将来根据需要进行更改。
最后我发现 the Illinois chunker 正是我需要的。