无法解析页面正文
Can't parse body of page
我正在尝试从一页中解析一些 href
,我的代码如下所示:
WebClient webClient = new WebClient();
string htmlCode = webClient.DownloadString("https://www.firmy.cz/Auto-moto");
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlCode);
HtmlNodeCollection collection = doc.DocumentNode.SelectNodes("//div[contains(@class,'companyWrap')]");
string target = "";
foreach (HtmlNode link in collection)
{
target = target +"\n"+ link.Attributes["href"].Value;
}
在此页面上,我的 doc.ParsedText
没有正文 <body id="root" class="root">
</body>
但如果我转到该页,我会看到正文的元素。你能告诉我哪里有问题吗?
Blockquote
如果您查看要解析的 URL 的来源 (https://www.firmy.cz/Auto-moto),您可以看到正文是空的。
该页面似乎正在通过 JavaScript 在客户端加载内容,因此您无法解析。
我正在尝试从一页中解析一些 href
,我的代码如下所示:
WebClient webClient = new WebClient();
string htmlCode = webClient.DownloadString("https://www.firmy.cz/Auto-moto");
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlCode);
HtmlNodeCollection collection = doc.DocumentNode.SelectNodes("//div[contains(@class,'companyWrap')]");
string target = "";
foreach (HtmlNode link in collection)
{
target = target +"\n"+ link.Attributes["href"].Value;
}
在此页面上,我的 doc.ParsedText
没有正文 <body id="root" class="root">
</body>
但如果我转到该页,我会看到正文的元素。你能告诉我哪里有问题吗?
Blockquote
如果您查看要解析的 URL 的来源 (https://www.firmy.cz/Auto-moto),您可以看到正文是空的。
该页面似乎正在通过 JavaScript 在客户端加载内容,因此您无法解析。