高效的 XPath 语法专门提取单个组件

efficient XPath syntax exclusively extract single component

我使用 Firefox-Aurora 从该网站确定了以下 HTML 片段:http://www.zdic.net/z/19/js/5DCD.htm.

我只想提取组件 丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶

它位于以下代码块的底部附近:

<tr>

<td class="z_i_t4_uno" align="center">

    <a href="http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5DCD" target="_blank"> 

        <img src="/images/unicode2.gif" border="0" align="absmiddle">

    </a> 

    U+5DCD

</td>

<td class="z_i_t4" align="center">

    <span class="diczx7">

        MTVC

    </span>

</td>

<td class="z_i_t4" align="center">

    <span class="diczx7">

        UHVI

    </span>

</td>

<td class="z_i_t4" align="center">

    <span class="diczx7">

        LLZN

    </span>

</td>

<td style="background-color: transparent;" class="z_i_t4" align="center">

    <span class="diczx6">

        22413

    </span>

</td>

<td class="z_i_t4" align="center">

    <span id="z_i_t2_bis" title="竖折竖撇横竖撇捺折撇横撇竖折横横撇折折捺">

    丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶

    </span>

</td>

我一直在尝试不同的 XPath 序列在这个网站的帮助下确定它:http://www.xpathtester.com/xpath 但我似乎无法掌握它。

类似 //title[@td] 的结果是

WARNING - Processing of namespace declaration [//title[@td]] failed.    Right format: PREFIX=NAMESPACE. Declaration skipped.
ERROR - Seem there is no XPath provided?

我怎样才能确保我只收集那个序列而不收集其他的?

试试这个代码

xpath=tr/td/span[@id='z_i_t2_bis']

您收到的警告和错误特定于您用来测试 XPath 表达式的站点。您似乎使用了一种用于在 http://www.xpathtester.com/xpath.

上声明名称空间的语法

鉴于您知道如何提交 XPath 表达式,以下工作正常:

//td[@class = 'z_i_t4'][last()]/span/text()

并且只给你想要的文本节点:

丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶