如何编写 SPARQL 查询以获取基于外部主题的计数

How to write SPARQL query to fetch counts based on outer subject

我正在努力编写一个 SPARQL 查询来获取所有者的产品列表以及其他所有者的数量。

以下是我希望得到结果的查询

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX schema:<http://schema.org/>
SELECT distinct ?uri ?label ?r ?ownership ?rating ?comments ?allOwners
FROM <http://xxxx.net/>
WHERE  {
  ?r rdf:type <http://schema.org/Relation> . 
  ?r schema:property ?uri.
  ?r schema:owner ?owner .
  ?r schema:ownership ?ownership .
  ?uri rdfs:label ?label .
  OPTIONAL {?r schema:comments ?comments .}
  OPTIONAL {?r schema:rating ?rating .}
  filter (?owner =<http://xxxx.net/resource/37654824-334f-4e57-a40c-4078cac9c579>)

{
    SELECT (count(distinct ?owner) as ?allOwners)
    FROM <http://xxxx.net/>
    where {
      ?relation rdf:type <http://schema.org/Relation> .
      ?relation schema:owner ?owner .
      ?relation schema:property ?uri .
    } group by ?uri
  }
}

但它会复制结果以及随机计数值。

如何编写这样的查询,我知道内部查询在外部查询之前运行但是如何在内部查询中为外部结果的每条记录使用?uri(主题)?

SPARQL 查询语义指定查询的各个部分如何连接在一起。您的子查询不会投影与外部查询共享的任何公共变量。它只是 SELECT?allOwners 变量,它没有出现在查询的其余部分。

这意味着您得到所有​​计数和所有其他结果的叉积;这就是为什么您会得到重复的行并且计数和行之间没有相关性的原因。

如果结构正确,这种查询是可以实现的。由于您没有提供您想要的示例结果,我不得不对您想要的做出最好的猜测。像下面这样的东西可能有想要的结果:

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX schema:<http://schema.org/>

SELECT distinct ?uri ?label ?r ?ownership ?rating ?comments ?allOwners
FROM <http://xxxx.net/>
WHERE  
{
  ?r rdf:type <http://schema.org/Relation> . 
  ?r schema:property ?uri.
  ?r schema:owner ?owner .
  ?r schema:ownership ?ownership .
  ?uri rdfs:label ?label .
  FILTER (?owner = <http://xxxx.net/resource/37654824-334f-4e57-a40c-4078cac9c579>)
  {
    SELECT ?uri (count(distinct ?owner) as ?allOwners)
    FROM <http://xxxx.net/>
    WHERE 
    {
      ?relation rdf:type <http://schema.org/Relation> .
      ?relation schema:owner ?owner .
      ?relation schema:property ?uri .
    } GROUP BY ?uri
  }
  OPTIONAL { ?r schema:comments ?comments . }
  OPTIONAL { ?r schema:rating ?rating . }
}

这与您的原始查询不同,如下所示:

  • 在查询中更快地将 FILTER 置于 ?owner 上,以帮助查询引擎更快地应用它。
    • FILTER 位置通常非常灵活,除非您使用嵌套图形模式(如 OPTIONALMINUS),在这种情况下,将其放在这些子句之后可能会应用它晚于您的预期
    • 作为一般规则,在引入所有需要的变量后尽快放置 FILTER 子句
  • 将子查询中的 GROUP BY 变量 ?uri 添加到子查询的 SELECT
    • 这确保查询引擎可以将 ?allOwners 计数与其所属的 ?uri 相关联
    • 这也删除了应删除重复结果和不良相关性的叉积

这可能是也可能不是您要查询的内容,但希望它能帮助您指明正确的方向