在 GraphDB 上设置 OpenRefine 协调端点

Setting up an OpenRefine reconciliation endpoint over GraphDB

GraphDB 的最新版本提供了一个集成的 OpenRefine 工具，它对根据现有词汇表协调数据提供了所有重要的支持，前提是它们通过 OpenRefine 兼容的协调公开 API，然后您可以从 GraphDB/OpenRefine 调用它。现在，根据我从最近的 GraphDB 谈话中获得的一些提示，我预计这样的协调 API 也会自动暴露在 GraphDB 本身的数据上（可能涉及 Lucene 连接器），以便您可以协调新的表格数据针对已经在您的 RDF 图中的实体。但不幸的是，我在文档和最新的 GraphDB 版本中都找不到有关此类支持的任何信息。是否有任何直接的方法可以通过 RDF 数据/SPARQL 端点设置此类服务？预先感谢您提供任何提示。

我不知道 GraphDB 中有任何这样的端点 - 我同意拥有它是一件非常好的事情。

作为一种解决方法，您可以使用 RDF extension，它允许您从 SPARQL 端点创建协调服务 - 但这通常非常慢并且取决于特定的 SPARQL 引擎（所以我什至不确定这是否可行使用 GraphDB）。

OntoRefine 还没有内置对帐服务器。但是，我们正在处理这个项目的一部分 https://www.ontotext.com/knowledgehub/current/cima-project/。我们已经有了一个 VIAF 侦察服务器，我们正在考虑将其作为免费服务提供。还有一种更通用的方法来设置侦察 RDF 数据，使用 Elastic 进行评分。

（grefine rdf 扩展不适合这个目的：它没有评分，你甚至不能告诉它使用哪个 lucene 索引）

2020 年 9 月更新：

我们开发了一个 VIAF 侦察服务器，它比以前的服务器要好得多。它考虑了姓名变体，解析出国籍和职业，并根据一些“重要性”指标对候选人进行排序。我们还没有部署它，因为我们正在寻找客户。
您可以使用上述 VIAF 服务器使用的相同框架（基于将 RDF 属性映射到 Lucene/Elastic 并使用其“相似”功能）对 RDF 数据进行侦察。同样，我们正在寻找客户或借口将此框架作为 GraphDB 的一部分发布。

在 GraphDB 上设置 OpenRefine 协调端点

Setting up an OpenRefine reconciliation endpoint over GraphDB

openrefine

graphdb