将外部文本数据索引到 GraphDB 中的 lucene 索引

Indexing external text data to lucene index in GraphDB

是否可以在 RDF 数据外部建立索引? 就像在 RDF 中一样,有一个三元组,对象作为外部文件的 link。可以索引此文件的内容而不是 link 值吗?

当然可以。 Lucene 是 GraphDB 的核心部分,它提供独立 Lucene 附带的标准功能。必须将数据参数化为字符串文字。 <http://www.example.org/> rdfs:label "An example webpage url."@EN . 然后就可以配置一个Lucene Index了:

PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
  luc:index luc:setParam "uris" .
  luc:include luc:setParam "literals" .
  luc:moleculeSize luc:setParam "1" .
  luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
}

配置完成后,就可以创建索引了。

PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
   luc:myTestIndex luc:createIndex "true" .
}

并且,给定索引和您的数据,您可以查询它。

PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
SELECT * {
  ?subj luc:myTestIndex "web*"
}

由于您询问的是包含字符串 web* 的主题,因此您会得到 <http://www.example.org/>。如果您有其他三元组链接到此三元组,它们可能也会出现。

可以在 GraphDB 文档中找到有关 GraphDB 与 Lucene and its Full-Text-Search 功能交互方式的更多信息。

我怀疑上面的回答误解了问题。该问题涉及外部内容——即,如果 GraphDB 的 Lucene 能够索引 http://example.org 处可用的内容,而不是与其关联的 RDF 文字(然后 return 搜索指向该内容的三元组).

根据我的尝试,目前不支持此功能。