计算 xml 标签中出现频率最高的元素
Count most frequent element in an xml tag
我正在尝试编写一个 xsl 代码来查看出现次数最多的期刊名称。我尝试用谷歌搜索它,但无法理解其中的大部分内容(我是 xslt 的新手)。谁能帮我解决这个问题?
我的XML(只有一个条目):
<Bibliography>
<row>
<Title>Title-B-0</Title>
<Author>Jason Adair</Author>
<Year>2015</Year>
<Publication_Name>ACM</Publication_Name>
<DOI>533/49</DOI>
<Date>6/2/2021</Date>
<Journal_Name>journal-s</Journal_Name>
<Journal_Volume>9</Journal_Volume>
<Journal_Issue>8</Journal_Issue>
<Conference_Name></Conference_Name>
<Conference_Location></Conference_Location>
<Book_Title></Book_Title>
<Book_Editor></Book_Editor>
</row>
</Bibliography>
我的 XSL 方法:
<xsl:variable name="maximum">
<xsl:for-each select="//row">
<xsl:sort select="count(//row[@Journal_Name=current()/@Journal_Name])" order="descending" />
<xsl:if test="position() = 1">
<xsl:value-of select="." />
</xsl:if>
</xsl:for-each>
</xsl:variable>
Most occuring value of journal is: <xsl:value-of select = "$maximum" />
此外,在我观看的 YouTube 教程中,浏览器中 运行 xml 的人会自动设置样式,但当我这样做时,我做不到。新浏览器是否不再支持 xml 和 xsl?
这其实是一道分组题。假设您正在使用 XSLT 1.0 处理器,最好使用 Muenchian grouping method 的变体。这是一个简化的例子:
XML
<Bibliography>
<row>
<Journal_Name>journal-a</Journal_Name>
</row>
<row>
<Journal_Name>journal-b</Journal_Name>
</row>
<row>
<Journal_Name>journal-c</Journal_Name>
</row>
<row>
<Journal_Name>journal-b</Journal_Name>
</row>
<row>
<Journal_Name>journal-c</Journal_Name>
</row>
<row>
<Journal_Name>journal-d</Journal_Name>
</row>
<row>
<Journal_Name>journal-b</Journal_Name>
</row>
</Bibliography>
XSLT 1.0
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:key name="row-by-journal" match="row" use="Journal_Name" />
<xsl:template match="/Bibliography">
<output>
<!-- for each distinct journal name -->
<xsl:for-each select="row[count(. | key('row-by-journal', Journal_Name)[1]) = 1]">
<!-- sort by group size -->
<xsl:sort select="count(key('row-by-journal', Journal_Name))" data-type="number" order="descending"/>
<xsl:if test="position() = 1">
<xsl:value-of select="Journal_Name" />
</xsl:if>
</xsl:for-each>
</output>
</xsl:template>
</xsl:stylesheet>
结果
<?xml version="1.0" encoding="UTF-8"?>
<output>journal-b</output>
请注意,如果出现平局,此方法将 return 只有最高值之一。
我正在尝试编写一个 xsl 代码来查看出现次数最多的期刊名称。我尝试用谷歌搜索它,但无法理解其中的大部分内容(我是 xslt 的新手)。谁能帮我解决这个问题?
我的XML(只有一个条目):
<Bibliography>
<row>
<Title>Title-B-0</Title>
<Author>Jason Adair</Author>
<Year>2015</Year>
<Publication_Name>ACM</Publication_Name>
<DOI>533/49</DOI>
<Date>6/2/2021</Date>
<Journal_Name>journal-s</Journal_Name>
<Journal_Volume>9</Journal_Volume>
<Journal_Issue>8</Journal_Issue>
<Conference_Name></Conference_Name>
<Conference_Location></Conference_Location>
<Book_Title></Book_Title>
<Book_Editor></Book_Editor>
</row>
</Bibliography>
我的 XSL 方法:
<xsl:variable name="maximum">
<xsl:for-each select="//row">
<xsl:sort select="count(//row[@Journal_Name=current()/@Journal_Name])" order="descending" />
<xsl:if test="position() = 1">
<xsl:value-of select="." />
</xsl:if>
</xsl:for-each>
</xsl:variable>
Most occuring value of journal is: <xsl:value-of select = "$maximum" />
此外,在我观看的 YouTube 教程中,浏览器中 运行 xml 的人会自动设置样式,但当我这样做时,我做不到。新浏览器是否不再支持 xml 和 xsl?
这其实是一道分组题。假设您正在使用 XSLT 1.0 处理器,最好使用 Muenchian grouping method 的变体。这是一个简化的例子:
XML
<Bibliography>
<row>
<Journal_Name>journal-a</Journal_Name>
</row>
<row>
<Journal_Name>journal-b</Journal_Name>
</row>
<row>
<Journal_Name>journal-c</Journal_Name>
</row>
<row>
<Journal_Name>journal-b</Journal_Name>
</row>
<row>
<Journal_Name>journal-c</Journal_Name>
</row>
<row>
<Journal_Name>journal-d</Journal_Name>
</row>
<row>
<Journal_Name>journal-b</Journal_Name>
</row>
</Bibliography>
XSLT 1.0
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:key name="row-by-journal" match="row" use="Journal_Name" />
<xsl:template match="/Bibliography">
<output>
<!-- for each distinct journal name -->
<xsl:for-each select="row[count(. | key('row-by-journal', Journal_Name)[1]) = 1]">
<!-- sort by group size -->
<xsl:sort select="count(key('row-by-journal', Journal_Name))" data-type="number" order="descending"/>
<xsl:if test="position() = 1">
<xsl:value-of select="Journal_Name" />
</xsl:if>
</xsl:for-each>
</output>
</xsl:template>
</xsl:stylesheet>
结果
<?xml version="1.0" encoding="UTF-8"?>
<output>journal-b</output>
请注意,如果出现平局,此方法将 return 只有最高值之一。