高效的 XPath 语法专门提取单个组件
efficient XPath syntax exclusively extract single component
我使用 Firefox-Aurora 从该网站确定了以下 HTML 片段:http://www.zdic.net/z/19/js/5DCD.htm
.
我只想提取组件 丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶
。
它位于以下代码块的底部附近:
<tr>
<td class="z_i_t4_uno" align="center">
<a href="http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5DCD" target="_blank">
<img src="/images/unicode2.gif" border="0" align="absmiddle">
</a>
U+5DCD
</td>
<td class="z_i_t4" align="center">
<span class="diczx7">
MTVC
</span>
</td>
<td class="z_i_t4" align="center">
<span class="diczx7">
UHVI
</span>
</td>
<td class="z_i_t4" align="center">
<span class="diczx7">
LLZN
</span>
</td>
<td style="background-color: transparent;" class="z_i_t4" align="center">
<span class="diczx6">
22413
</span>
</td>
<td class="z_i_t4" align="center">
<span id="z_i_t2_bis" title="竖折竖撇横竖撇捺折撇横撇竖折横横撇折折捺">
丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶
</span>
</td>
我一直在尝试不同的 XPath 序列在这个网站的帮助下确定它:http://www.xpathtester.com/xpath
但我似乎无法掌握它。
类似 //title[@td]
的结果是
WARNING - Processing of namespace declaration [//title[@td]] failed. Right format: PREFIX=NAMESPACE. Declaration skipped.
ERROR - Seem there is no XPath provided?
我怎样才能确保我只收集那个序列而不收集其他的?
试试这个代码
xpath=tr/td/span[@id='z_i_t2_bis']
您收到的警告和错误特定于您用来测试 XPath 表达式的站点。您似乎使用了一种用于在 http://www.xpathtester.com/xpath.
上声明名称空间的语法
鉴于您知道如何提交 XPath 表达式,以下工作正常:
//td[@class = 'z_i_t4'][last()]/span/text()
并且只给你想要的文本节点:
丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶
我使用 Firefox-Aurora 从该网站确定了以下 HTML 片段:http://www.zdic.net/z/19/js/5DCD.htm
.
我只想提取组件 丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶
。
它位于以下代码块的底部附近:
<tr>
<td class="z_i_t4_uno" align="center">
<a href="http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5DCD" target="_blank">
<img src="/images/unicode2.gif" border="0" align="absmiddle">
</a>
U+5DCD
</td>
<td class="z_i_t4" align="center">
<span class="diczx7">
MTVC
</span>
</td>
<td class="z_i_t4" align="center">
<span class="diczx7">
UHVI
</span>
</td>
<td class="z_i_t4" align="center">
<span class="diczx7">
LLZN
</span>
</td>
<td style="background-color: transparent;" class="z_i_t4" align="center">
<span class="diczx6">
22413
</span>
</td>
<td class="z_i_t4" align="center">
<span id="z_i_t2_bis" title="竖折竖撇横竖撇捺折撇横撇竖折横横撇折折捺">
丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶
</span>
</td>
我一直在尝试不同的 XPath 序列在这个网站的帮助下确定它:http://www.xpathtester.com/xpath
但我似乎无法掌握它。
类似 //title[@td]
的结果是
WARNING - Processing of namespace declaration [//title[@td]] failed. Right format: PREFIX=NAMESPACE. Declaration skipped.
ERROR - Seem there is no XPath provided?
我怎样才能确保我只收集那个序列而不收集其他的?
试试这个代码
xpath=tr/td/span[@id='z_i_t2_bis']
您收到的警告和错误特定于您用来测试 XPath 表达式的站点。您似乎使用了一种用于在 http://www.xpathtester.com/xpath.
上声明名称空间的语法鉴于您知道如何提交 XPath 表达式,以下工作正常:
//td[@class = 'z_i_t4'][last()]/span/text()
并且只给你想要的文本节点:
丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶