在 GraphDB 上设置 OpenRefine 协调端点

Setting up an OpenRefine reconciliation endpoint over GraphDB

GraphDB 的最新版本提供了一个集成的 OpenRefine 工具,它对根据现有词汇表协调数据提供了所有重要的支持,前提是它们通过 OpenRefine 兼容的协调公开 API,然后您可以从 GraphDB/OpenRefine 调用它。现在,根据我从最近的 GraphDB 谈话中获得的一些提示,我预计这样的协调 API 也会自动暴露在 GraphDB 本身的数据上(可能涉及 Lucene 连接器),以便您可以协调新的表格数据针对已经在您的 RDF 图中的实体。但不幸的是,我在文档和最新的 GraphDB 版本中都找不到有关此类支持的任何信息。是否有任何直接的方法可以通过 RDF 数据/SPARQL 端点设置此类服务?预先感谢您提供任何提示。

我不知道 GraphDB 中有任何这样的端点 - 我同意拥有它是一件非常好的事情。

作为一种解决方法,您可以使用 RDF extension,它允许您从 SPARQL 端点创建协调服务 - 但这通常非常慢并且取决于特定的 SPARQL 引擎(所以我什至不确定这是否可行使用 GraphDB)。

OntoRefine 还没有内置对帐服务器。但是,我们正在处理这个项目的一部分 https://www.ontotext.com/knowledgehub/current/cima-project/。我们已经有了一个 VIAF 侦察服务器,我们正在考虑将其作为免费服务提供。 还有一种更通用的方法来设置侦察 RDF 数据,使用 Elastic 进行评分。

(grefine rdf 扩展不适合这个目的:它没有评分,你甚至不能告诉它使用哪个 lucene 索引)

2020 年 9 月更新:

  • 我们开发了一个 VIAF 侦察服务器,它比以前的服务器要好得多。它考虑了姓名变体,解析出国籍和职业,并根据一些“重要性”指标对候选人进行排序。我们还没有部署它,因为我们正在寻找客户。
  • 您可以使用上述 VIAF 服务器使用的相同框架(基于将 RDF 属性映射到 Lucene/Elastic 并使用其“相似”功能)对 RDF 数据进行侦察。同样,我们正在寻找客户或借口将此框架作为 GraphDB 的一部分发布。