斯坦福核心 NLP 树解析器句子限制错误 - 建议？

Stanford Core NLP Tree Parser Sentence Limits wrong - suggestions?

我正在处理 german 法律文件，想为句子生成解析树。我可以找到并使用 Standford CoreNLP Parser。但是，在解析文档的句子时，它无法像其他工具（例如 spaCy）那样识别句子限制。例如，它会在每个“.”字符处中断句子，包括。缩写词末尾的点，例如“incl.”）由于覆盖整个句子对于创建语法树至关重要，因此这对我来说并不奏效。

我将不胜感激任何解决此问题的建议，尤其是指向可能更适合我的问题的其他软件的建议。如果我忽略了调整 Stanford 解析器的可能性，我将非常感谢任何关于如何让它更好地检测句子限制的提示。

快速浏览一下文档就知道了：您可以运行您的管道，其中可能包含 sentence splitter，具有属性 ssplit.isOneSentence = true 基本上禁用它。这意味着您可以预先拆分句子，例如使用 spaCy，然后将单个句子输入管道。

斯坦福核心 NLP 树解析器句子限制错误 - 建议？

Stanford Core NLP Tree Parser Sentence Limits wrong - suggestions?

nlp

parse-tree

stanford-nlp