c#, html-agility-pack 获取不在标签内的文本
c#, html-agility-pack get text which is not inside tags
这是我的 HTML:
<a class="bla"></a>
25 oct 2012
我怎么只能得到2012年10月25日。文本不在任何标签内。
我正在使用 c# htmlagilitypack 库。
基本上,您可以使用 text()
来引用 XPath 中的文本节点。尝试将以下 XPath 传递给 HtmlAgilityPack 的 SelectNodes()
或 SelectSingleNode()
方法:
//a[@class='bla']/following-sibling::text()[1]
简要说明:
//a[@class='bla']
: 在 HTML 文档中的任何地方找到 <a>
元素,其 class
属性等于 "bla"
...
/following-sibling::text()[1]
: 然后从 <a>
return 最接近的文本节点跟随
这是我的 HTML:
<a class="bla"></a>
25 oct 2012
我怎么只能得到2012年10月25日。文本不在任何标签内。 我正在使用 c# htmlagilitypack 库。
基本上,您可以使用 text()
来引用 XPath 中的文本节点。尝试将以下 XPath 传递给 HtmlAgilityPack 的 SelectNodes()
或 SelectSingleNode()
方法:
//a[@class='bla']/following-sibling::text()[1]
简要说明:
//a[@class='bla']
: 在 HTML 文档中的任何地方找到<a>
元素,其class
属性等于"bla"
.../following-sibling::text()[1]
: 然后从<a>
return 最接近的文本节点跟随