使用 XSLT 将连字符括在其自己的元素中
Enclose hyphenation in its own element with XSLT
给出以下 XML:
<p>
<lb/>Aber, Schertz bey Seite geſetzet; wer mir und ſo viel ehrlichen
<lb/>Bieder-Maͤnnern nicht glauben will, der probire es bey den haͤuffigen Kirchen-
<lb/>Sachen, die ein Sangloser Organiſt etwa geſchmadert hat, (denn es gibt frucht-
<lb/>bare Naͤchte bey dieſen Leuten, [...]
</p>
是否有一种纯 XSLT 方法可以将其转换成这样?
<p>
<lb/>Aber, Schertz bey Seite geſetzet; wer mir und ſo viel ehrlichen
<lb/>Bieder-Maͤnnern nicht glauben will, der probire es bey den haͤuffigen Kirchen<pc force="strong">-</pc>
<lb/>Sachen, die ein Sangloser Organiſt etwa geſchmadert hat, (denn es gibt frucht<pc force="weak">-</pc>
<lb/>bare Naͤchte bey dieſen Leuten, [...]
</p>
如果<lb>
元素后面的第一个字母是大写字母,则force
属性应该是strong
,否则是weak
.
目前我完全不知道如何 select 一个以特定字母 (-
) 结尾的文本节点和一个 <lb>
-sibling,它本身后面跟着大写字母字母 ...
使用 XSLT 3(但仅用于使用 xsl:mode
声明身份转换并使用 ||
而不是 concat()
和 analyze-string
,后者可以用 xsl:analyze-string
) the following sample
<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="3.0"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
exclude-result-prefixes="#all"
expand-text="yes">
<xsl:param name="sep" as="xs:string">-</xsl:param>
<xsl:param name="pattern" as="xs:string" select="'(' || $sep || ')' || '(\s*)$'"/>
<xsl:mode on-no-match="shallow-copy"/>
<xsl:template match="p/text()[matches(., $pattern)][following-sibling::node()[1][self::lb]]">
<xsl:value-of select="replace(., $pattern, '')"/>
<pc force="{if (following-sibling::node()[2][self::text()[matches(., '^\p{Lu}')]]) then 'strong' else 'weak'}">{$sep}</pc>
<xsl:value-of select="analyze-string(., $pattern)//*:group[@nr = 2]"/>
</xsl:template>
</xsl:stylesheet>
应该做的。如果文本后跟 <lb/><foo>...</foo>
,则匹配文本节点的模式可能需要更具体,例如lb
不一定跟在您的示例中的文本节点。
给出以下 XML:
<p>
<lb/>Aber, Schertz bey Seite geſetzet; wer mir und ſo viel ehrlichen
<lb/>Bieder-Maͤnnern nicht glauben will, der probire es bey den haͤuffigen Kirchen-
<lb/>Sachen, die ein Sangloser Organiſt etwa geſchmadert hat, (denn es gibt frucht-
<lb/>bare Naͤchte bey dieſen Leuten, [...]
</p>
是否有一种纯 XSLT 方法可以将其转换成这样?
<p>
<lb/>Aber, Schertz bey Seite geſetzet; wer mir und ſo viel ehrlichen
<lb/>Bieder-Maͤnnern nicht glauben will, der probire es bey den haͤuffigen Kirchen<pc force="strong">-</pc>
<lb/>Sachen, die ein Sangloser Organiſt etwa geſchmadert hat, (denn es gibt frucht<pc force="weak">-</pc>
<lb/>bare Naͤchte bey dieſen Leuten, [...]
</p>
如果<lb>
元素后面的第一个字母是大写字母,则force
属性应该是strong
,否则是weak
.
目前我完全不知道如何 select 一个以特定字母 (-
) 结尾的文本节点和一个 <lb>
-sibling,它本身后面跟着大写字母字母 ...
使用 XSLT 3(但仅用于使用 xsl:mode
声明身份转换并使用 ||
而不是 concat()
和 analyze-string
,后者可以用 xsl:analyze-string
) the following sample
<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="3.0"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
exclude-result-prefixes="#all"
expand-text="yes">
<xsl:param name="sep" as="xs:string">-</xsl:param>
<xsl:param name="pattern" as="xs:string" select="'(' || $sep || ')' || '(\s*)$'"/>
<xsl:mode on-no-match="shallow-copy"/>
<xsl:template match="p/text()[matches(., $pattern)][following-sibling::node()[1][self::lb]]">
<xsl:value-of select="replace(., $pattern, '')"/>
<pc force="{if (following-sibling::node()[2][self::text()[matches(., '^\p{Lu}')]]) then 'strong' else 'weak'}">{$sep}</pc>
<xsl:value-of select="analyze-string(., $pattern)//*:group[@nr = 2]"/>
</xsl:template>
</xsl:stylesheet>
应该做的。如果文本后跟 <lb/><foo>...</foo>
,则匹配文本节点的模式可能需要更具体,例如lb
不一定跟在您的示例中的文本节点。