斯坦福核心 NLP 树解析器句子限制错误 - 建议?

Stanford Core NLP Tree Parser Sentence Limits wrong - suggestions?

我正在处理 german 法律文件,想为句子生成解析树。我可以找到并使用 Standford CoreNLP Parser。但是,在解析文档的句子时,它无法像其他工具(例如 spaCy)那样识别句子限制。例如,它会在每个“.”字符处中断句子,包括。缩写词末尾的点,例如“incl.”) 由于覆盖整个句子对于创建语法树至关重要,因此这对我来说并不奏效。

我将不胜感激任何解决此问题的建议,尤其是指向可能更适合我的问题的其他软件的建议。如果我忽略了调整 Stanford 解析器的可能性,我将非常感谢任何关于如何让它更好地检测句子限制的提示。

快速浏览一下文档就知道了:您可以 运行 您的管道,其中可能包含 sentence splitter,具有属性 ssplit.isOneSentence = true 基本上禁用它。这意味着您可以预先拆分句子,例如使用 spaCy,然后将单个句子输入管道。