为什么这个 XQuery 过滤 return 不需要的元素?

Why does this XQuery filter return unwanted elements?

我正在使用实现 XQuery 3.1 的 BaseX 8.4.1

我正在尝试在 XQuery 中做一些非常基本的事情,但我似乎无法弄清楚。

我创建了一些示例数据来说明我正在尝试做的事情。我的数据集看起来像这样。它是一个简单的嵌入式结构。有几天,每天都有一些活动,活动有成员。

数据

<root>
    <day>
        <name>1</name>
        <event>
            <name>1</name>
            <member>A</member>
            <member>B</member>
        </event>
        <event>
            <name>2</name>
            <member>C</member>
        </event>
    </day>
    <day>
        <name>2</name>
        <event>
            <name>3</name>
            <member>A</member>
            <member>B</member>
        </event>
        <event>
            <name>4</name>
            <member>C</member>
        </event>
    </day>
    <day>
        <name>3</name>
        <event>
            <name>5</name>
            <member>C</member>
        </event>
    </day>
</root>

我想做的是获取成员列表,并为每个成员获取他们举办活动的日期列表,以及他们举办的活动。所以结果应该是这样的:

期望的结果

<member>
  <name>A</name>
  <day>
    <name>1</name>
    <event>
      <name>1</name>
      <member>A</member>
      <member>B</member>
    </event>
  </day>
  <day>
    <name>2</name>
    <event>
      <name>3</name>
      <member>A</member>
      <member>B</member>
    </event>
  </day>
</member>
<member>
  <name>B</name>
  <day>
    <name>1</name>
    <event>
      <name>1</name>
      <member>A</member>
      <member>B</member>
    </event>
  </day>
  <day>
    <name>2</name>
    <event>
      <name>3</name>
      <member>A</member>
      <member>B</member>
    </event>
  </day>
</member>
<member>
  <name>C</name>
  <day>
    <name>1</name>
    <event>
      <name>2</name>
      <member>C</member>
    </event>
  </day>
  <day>
    <name>2</name>
    <event>
      <name>4</name>
      <member>C</member>
    </event>
  </day>
  <day>
    <name>3</name>
    <event>
      <name>5</name>
      <member>C</member>
    </event>
  </day>
</member>

为此,我尝试了以下 XQuery:

我试过的

for $member in distinct-values(//member)
return
<member>
  <name>{$member}</name>
    {for $day in //day where $day/event/member = $member
      let $event := $day/event where $event/member = $member
    return 
      <day>
        {$day/name}
        {$event}
    </day>}
</member>

但是,这不应用过滤。所以我保留了一个成员的所有事件,他们不是成员:

我得到了什么

<member>
  <name>A</name>
  <day>
    <name>1</name>
    <event>
      <name>1</name>
      <member>A</member>
      <member>B</member>
    </event>
    <event>
      <name>2</name>
      <member>C</member>
    </event>
  </day>
  <day>
    <name>2</name>
    <event>
      <name>3</name>
      <member>A</member>
      <member>B</member>
    </event>
    <event>
      <name>4</name>
      <member>C</member>
    </event>
  </day>
</member>
<member>
  <name>B</name>
  <day>
    <name>1</name>
    <event>
      <name>1</name>
      <member>A</member>
      <member>B</member>
    </event>
    <event>
      <name>2</name>
      <member>C</member>
    </event>
  </day>
  <day>
    <name>2</name>
    <event>
      <name>3</name>
      <member>A</member>
      <member>B</member>
    </event>
    <event>
      <name>4</name>
      <member>C</member>
    </event>
  </day>
</member>
<member>
  <name>C</name>
  <day>
    <name>1</name>
    <event>
      <name>1</name>
      <member>A</member>
      <member>B</member>
    </event>
    <event>
      <name>2</name>
      <member>C</member>
    </event>
  </day>
  <day>
    <name>2</name>
    <event>
      <name>3</name>
      <member>A</member>
      <member>B</member>
    </event>
    <event>
      <name>4</name>
      <member>C</member>
    </event>
  </day>
  <day>
    <name>3</name>
    <event>
      <name>5</name>
      <member>C</member>
    </event>
  </day>
</member>

当然,这应该很容易,不是吗?

这是一个非常小的问题。你想过滤事件,定义$events$day所有事件的顺序。然后,您使用具有设置语义的 = 运算符进行过滤——如果左侧的任何项目(all 当天的事件成员)等于任何项目在右侧(当前 $member),where 子句的计算结果为 true.

改为循环处理事件。

for $member in distinct-values(//member)
return
<member>
  <name>{$member}</name>
    {for $day in //day where $day/event/member = $member
      (: for instead of let :)
      for $event in $day/event where $event/member = $member
    return 
      <day>
        {$day/name}
        {$event}
    </day>}
</member>

使用谓词而不是 where 子句通常会使代码更易于阅读且嵌套的显式循环更少。这是一个清理过的例子:

for $member in distinct-values(//member)
return
  <member>{
    <name>{ $member }</name>,
    for $day in //day[event/member = $member]
    return 
      <day>{
        $day/name,
        $day/event[member = $member]
      }</day>
  }</member>

这是一个使用 group by 两次的替代解决方案,它只扫描一次源数据:

for $member in //member
group by $name := $member/text()
order by $name
return <member>{
    <name>{$name}</name>,
    for $event in $member/..
    group by $day := $event/../name
    order by $day
    return <day>{
        <name>{$day}</name>,
        $event
    }</day>
}</member>