将外部文本数据索引到 GraphDB 中的 lucene 索引
Indexing external text data to lucene index in GraphDB
是否可以在 RDF 数据外部建立索引?
就像在 RDF 中一样,有一个三元组,对象作为外部文件的 link。可以索引此文件的内容而不是 link 值吗?
当然可以。 Lucene 是 GraphDB 的核心部分,它提供独立 Lucene 附带的标准功能。必须将数据参数化为字符串文字。 <http://www.example.org/> rdfs:label "An example webpage url."@EN .
然后就可以配置一个Lucene Index了:
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
luc:index luc:setParam "uris" .
luc:include luc:setParam "literals" .
luc:moleculeSize luc:setParam "1" .
luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
}
配置完成后,就可以创建索引了。
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
luc:myTestIndex luc:createIndex "true" .
}
并且,给定索引和您的数据,您可以查询它。
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
SELECT * {
?subj luc:myTestIndex "web*"
}
由于您询问的是包含字符串 web* 的主题,因此您会得到 <http://www.example.org/>
。如果您有其他三元组链接到此三元组,它们可能也会出现。
可以在 GraphDB 文档中找到有关 GraphDB 与 Lucene and its Full-Text-Search 功能交互方式的更多信息。
我怀疑上面的回答误解了问题。该问题涉及外部内容——即,如果 GraphDB 的 Lucene 能够索引 http://example.org 处可用的内容,而不是与其关联的 RDF 文字(然后 return 搜索指向该内容的三元组).
根据我的尝试,目前不支持此功能。
是否可以在 RDF 数据外部建立索引? 就像在 RDF 中一样,有一个三元组,对象作为外部文件的 link。可以索引此文件的内容而不是 link 值吗?
当然可以。 Lucene 是 GraphDB 的核心部分,它提供独立 Lucene 附带的标准功能。必须将数据参数化为字符串文字。 <http://www.example.org/> rdfs:label "An example webpage url."@EN .
然后就可以配置一个Lucene Index了:
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
luc:index luc:setParam "uris" .
luc:include luc:setParam "literals" .
luc:moleculeSize luc:setParam "1" .
luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
}
配置完成后,就可以创建索引了。
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
luc:myTestIndex luc:createIndex "true" .
}
并且,给定索引和您的数据,您可以查询它。
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
SELECT * {
?subj luc:myTestIndex "web*"
}
由于您询问的是包含字符串 web* 的主题,因此您会得到 <http://www.example.org/>
。如果您有其他三元组链接到此三元组,它们可能也会出现。
可以在 GraphDB 文档中找到有关 GraphDB 与 Lucene and its Full-Text-Search 功能交互方式的更多信息。
我怀疑上面的回答误解了问题。该问题涉及外部内容——即,如果 GraphDB 的 Lucene 能够索引 http://example.org 处可用的内容,而不是与其关联的 RDF 文字(然后 return 搜索指向该内容的三元组).
根据我的尝试,目前不支持此功能。