斯坦福基于精确字典的命名实体识别

Exact Dictionary based Named Entity Recognition with Stanford

我有一本从维基百科中提取的命名实体字典。我想将它用作 NER 的字典。我想知道如何将 Stanford-NER 与我的这些数据一起使用。 我也下载了 Lingpipe,虽然我不知道如何使用它。我将不胜感激各种信息。

感谢您的帮助。

Stanford-NER 基于 CRF,这是一种统计模型。恐怕它不支持额外的词典或词典。但是,您可以根据自己的任务训练新模型。

您可以将字典(或基于正则表达式的)命名实体识别与 Stanford CoreNLP 结合使用。见RegexNER annotator。对于某些应用程序,我们 运行 使用相当大的实体字典。然而,对我们来说,这通常是使用统计(基于 CRF)NER 的辅助工具。

您可以使用 MER:http://labs.fc.ul.pt/mer/

在 bash 中开发的最小实体识别器:https://github.com/lasigeBioTM/MER

只需要一个词典(文本文件)作为输入