如何提取htmlnode中的文本?

How to extract text in htmlnode?

使用敏捷性,我从指定网站提取了 htmlnode,但我无法检索 htmlnode.InnerHtml 中标记中的数据。

 HtmlNode table = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault;

如何获取这些字符串和数字?

这是我的插图!抱歉,因为我上传的照片有限。

My image.png

您的select或如图所示select是一组单元格,对于select第一个单元格,您将调用.FirstOrDefault()(注意括号)。

并且因为您 select 一个单元格(而不是 table),您可能不想调用您 selected“table”的 HtmlNode。

所以这应该有效:

HtmlNode firstCell = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault();
string firstCellText = firstCell.InnerText;

要获取数字,您将使用指向第二行的不同 xpath