将先前注释的文档导入 IBM Knowledge Studio

Importing previously annotated document to IBM Knowledge Studio

我正在研究构建用于实体提取的自定义模型。为此,我使用了一些 public 数据集,并想看看它在 IBM Knowledge Studio 中的表现。但是我发现很难找到一种方法将 public 数据集(已经注释)加载到 Knowledge Studio。

有文档说可以导入以前注释过的文档,但是没有具体说明格式 https://console.bluemix.net/docs/services/watson-knowledge-studio/create-project.html#create-project

文档还说,它可以来自 UIMA 分析引擎,我没有找到任何显示文件格式的好例子

有人可以帮忙吗?

Watson Knowledge Studio 可以处理从 Watson Explorer Content Analytics、Content Analytics Studio 或 Apache UIMA 导出的 XMI 文件。您可以在下面的文档中找到一些信息。

https://console.bluemix.net/docs/services/watson-knowledge-studio/preannotation.html#preannotation

希望这对其他人有帮助。

当您尝试将现有注释数据导入 Knowledge Studio 时,没有关于输入格式的明确文档。

我们通过手动注释 Knowledge Studio 中的几个文件并导出此数据来解决这个问题。我们对导出的数据进行了分析,并编写了自定义程序,将现有的注释文本转换为 Knowledge Studio 接受的格式。

然后将此数据导回 Knowledge Studio