opennlp 上的嵌套标签

nested tag on opennlp

嘿,我正在尝试为 opennlp 制作训练数据以检测句子中的位置名称。我被困在这样的事情上:

<START:location> <START:location> North Manchester <END> Hospital <END>

我真的需要检测那两个对象,医院名称和城市名称。我可以做些什么来实现这一目标?

我在 java 8

上使用 opennlp 库版本 1.6

你格式化标签的方式肯定不会像你想的那样工作,因为据我所知,外部标签将按字面意义获取内部标签字符串的内容(而且你基本上永远不会得到碰到了一些奇怪的东西)。我会用两个不同的标签复制句子,一个用于城市名称,一个用于医院。此外,你真的应该在你的句子中围绕这些标签有更多的上下文(如果可以的话使用完整的句子)。

在某些时候,你将不得不开始思考语义,因为在实体抽取本体的思想上,医院不是位置实体,它只能与一个相关。只是一个想法,有点学术性,但如果相关的话很有趣。