c#, html-agility-pack 获取不在标签内的文本

c#, html-agility-pack get text which is not inside tags

这是我的 HTML:

<a class="bla"></a>
25 oct 2012

我怎么只能得到2012年10月25日。文本不在任何标签内。 我正在使用 c# htmlagilitypack 库。

基本上,您可以使用 text() 来引用 XPath 中的文本节点。尝试将以下 XPath 传递给 HtmlAgilityPack 的 SelectNodes()SelectSingleNode() 方法:

//a[@class='bla']/following-sibling::text()[1]

简要说明:

  • //a[@class='bla'] : 在 HTML 文档中的任何地方找到 <a> 元素,其 class 属性等于 "bla"...
  • /following-sibling::text()[1] : 然后从 <a> return 最接近的文本节点跟随