我如何将 flair NER tagger 与 DKpro-core 一起使用

How can i use flair NER tagger with DKpro-core

DKpro 中已经有很多标注器,如 Stanford、opennlp 等,但我想知道如何在 DKpro-core 中实现 flair NER 标注器?

现有的 DKPro 核心集成标注器,如 Stanford、OpenNLP 等,要么是基于 Java 的,要么是 Java 兼容的。然而,flair NER 标注器模型是在 python 中开发的。因此将它们与DKPro核心连接起来需要一个中间件工具。

DKPro Cassis, a UIMA CAS processing library is written in Python (also available as pypi project)并且可以直接使用flair NER tagger等flair组件

DKPro Cassis可以导入DKPro核心组件生成的Cas对象,并使用flair ner提供的标签对SofA进行标注。注释完成后,Cas对象可以导出回DKPro核心。

上述分析的PoC正在进行中,将很快在这里更新。

完成了将 FlairNLP 集成到 DKPro 的 PoC here

如前所述,DKPro生成的CAS对象是在DKPro cassis的帮助下导入的。 SoFA 字符串由 FlairNLP 注释。 NER 注释是根据 DKPro NER 注释映射的。 CAS 被写回 xmi 文件,DKPro 可以读回该文件以进一步注释。