使用 Xpath 获取 html 标签之前或之后的文本
Get text before or after html tags using Xpath
我有html,我在这里进行了简化,我需要编写一个 xPath 来获取 phone 数字。
<td>
<font>
<b>
<font size="2">
<a href="#">Some link</a>
</font>
</b>
<br>
Abc Address
<br>
Country name
<br>
(123) 456-7890
<hr>
A sentence here..
<img src="/images/abc.gif">
</font>
</td>
我可以将锚标记内的文本提取为,
->filterXPath('//font//b//a')->extract('_text'); //returns some link
如何在最后一个 <br>
标签之后或第一个 <hr>
标签之前提取文本 (123) 456-7890?我访问过this link,但我无法正确理解。
我也试过这个:
->filterXPath('//font//br[last()]')->extract('_text'); // returns nothing but empty
Select 最后一个 br
,然后是它的第一个文本兄弟:
//font/br[last()]/following-sibling::text()[1]
我有html,我在这里进行了简化,我需要编写一个 xPath 来获取 phone 数字。
<td>
<font>
<b>
<font size="2">
<a href="#">Some link</a>
</font>
</b>
<br>
Abc Address
<br>
Country name
<br>
(123) 456-7890
<hr>
A sentence here..
<img src="/images/abc.gif">
</font>
</td>
我可以将锚标记内的文本提取为,
->filterXPath('//font//b//a')->extract('_text'); //returns some link
如何在最后一个 <br>
标签之后或第一个 <hr>
标签之前提取文本 (123) 456-7890?我访问过this link,但我无法正确理解。
我也试过这个:
->filterXPath('//font//br[last()]')->extract('_text'); // returns nothing but empty
Select 最后一个 br
,然后是它的第一个文本兄弟:
//font/br[last()]/following-sibling::text()[1]