无法解析页面正文

Question

我正在尝试从一页中解析一些 href，我的代码如下所示：

WebClient webClient = new WebClient();
string htmlCode = webClient.DownloadString("https://www.firmy.cz/Auto-moto");
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlCode);
HtmlNodeCollection collection = doc.DocumentNode.SelectNodes("//div[contains(@class,'companyWrap')]");
string target = "";
foreach (HtmlNode link in collection)
{
    target = target +"\n"+ link.Attributes["href"].Value;
}

在此页面上，我的 doc.ParsedText 没有正文 <body id="root" class="root"> </body> 但如果我转到该页，我会看到正文的元素。你能告诉我哪里有问题吗？

Blockquote

Answer 1

如果您查看要解析的 URL 的来源 (https://www.firmy.cz/Auto-moto)，您可以看到正文是空的。

该页面似乎正在通过 JavaScript 在客户端加载内容，因此您无法解析。

无法解析页面正文

Can't parse body of page

.net

c#

parsing

html-agility-pack