合并多个元素的值,取属性字段的平均值

Merge the values of multiple elements and take the average of the attribute field

我需要合并多个元素的值,取属性字段的平均值

[输入]

<xml>
   <characters>
       <char a="a1" b="b1" y="y1" z="z1"  start="1" weight="100">F</char>
       <char a="a2" b="b2" y="y2" z="z2"  start="0" weight="80">r</char>
       <char a="a3" b="b3" y="y3" z="z3"  start="0" weight="80">o</char>
       <char a="a4" b="b4" y="y4" z="z4"  start="0" weight="100">m</char>
       <char a="a5" b="b5" y="y5" z="z5"> </char>
       <char a="a6" b="b6" y="y6" z="z6"  start="1" weight="100">a</char>
       <char a="a7" b="b7" y="y7" z="z7"  start="0" weight="80">n</char>
       <char a="a8" b="b8" y="y8" z="z8"  start="0" weight="80">d</char>
       <char a="a9" b="b9" y="y9" z="z9"> </char>
   </characters>
</xml>

[输出]

<xml>
   <data>
       <word>
         <value>From</value>
         <coordinates>a1 b1 y4 z4</coordinates>
         <avgconfidence>90</avgconfidence>
        </word>

        <word>
            <value>and</value>
            <coordinates>a6 b6 y9 z9</coordinates>
            <avgconfidence>90</avgconfidence>
         </word>
  <data>
</xml>

我采纳了 @michael.hor257k in 的建议,在下面编写了部分 XSL .我确实尝试过 xsl:choose。它没有产生预期的结果

[XSLT]

<xsl:stylesheet version="1.0"
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" omit-xml-declaration="yes" indent="yes" />

    <xsl:template match="/">
        <data>
            <xsl:for-each select="characters">
               <word>
                    <value>
                        <xsl:for-each select="char">
                            <xsl:variable name="rec" select="." />
                            <xsl:if test="$rec/@start='1'">
                                <xsl:text>  <xsl:value-of select="$rec" /></xsl:text>
                            </xsl:if>
                        </xsl:for-each>
                    </value>

                     <coordinates>
            <xsl:value-of select="char[1]/@a"/>
            <xsl:text> </xsl:text>
            <xsl:value-of select="char[1]/@b"/>
            <xsl:text> </xsl:text>
            <xsl:value-of select="char[last()]/@y"/>
            <xsl:text> </xsl:text>
            <xsl:value-of select="char[last()]/@z"/>
        </coordinates>
                    <avgWeight>
                        <xsl:value-of select="sum(characters/char/@weight) div count(characters/char) "/>
                    </avgWeight>
                </word>

            </xsl:for-each>
        </data>
    </xsl:template>
</xsl:stylesheet>

请帮忙。

有趣的问题 - 您的部分 XSL 将适用于单个单词,但您需要一种方法将您的字符分割成单独的单词并分别处理每个单词。我将其视为分组任务,其中 "word" 由 char[@start='1'] 元素及其后续 char[@start='0'] 元素组成。因此,您可以使用 key 将每个非单词首字母 char 与其单词的开头相关联(即最近的前 start='1' 兄弟)

<xsl:stylesheet version="1.0"
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" omit-xml-declaration="yes" indent="yes" />

    <xsl:key name="wordChars" match="char[@start='0']"
             use="generate-id(preceding-sibling::char[@start='1'][1])" />

    <xsl:template match="/">
        <xml>
           <data>
               <xsl:apply-templates select="xml/characters/char[@start='1']" />
           </data>
        </xml>
    </xsl:template>

    <xsl:template match="char">
        <!-- all the chars in this word - . is the initial letter, the key gives the
             rest of the word -->
        <xsl:variable name="word" select=". | key('wordChars', generate-id())" />

        <word>
            <value>
                <xsl:for-each select="$word"><xsl:value-of select="."/></xsl:for-each>
            </value>
            <coordinates>
                <xsl:value-of select="concat(
                     $word[1]/@a, ' ', $word[1]/@b, ' ',
                     $word[last()]/@y, ' ', $word[last()]/@z)" />
            </coordinates>
            <avgconfidence>
                <xsl:value-of select="sum($word/@weight) div count($word)" />
            </avgconfidence>
        </word>
    </xsl:template>
</xsl:stylesheet>

当 运行 超过您的样本输入时,会产生

<xml>
  <data>
    <word>
      <value>From</value>
      <coordinates>a1 b1 y4 z4</coordinates>
      <avgconfidence>90</avgconfidence>
    </word>
    <word>
      <value>and</value>
      <coordinates>a6 b6 y8 z8</coordinates>
      <avgconfidence>86.6666666666667</avgconfidence>
    </word>
  </data>
</xml>

我认为这是正确的答案(结束坐标 y8 z8 而不是 y9 z9 和置信度 862/3 而不是第二个单词的 90)。