无法获得 URL 的确切来源
Not able to get the exact source for a URL
我正在尝试使用 C# 应用程序提取给定 URL 的源页面。现在我正在使用 class HttpWebRequest
。
奇怪的是,从这个class得到的结果页面与用Google Chrome浏览器(Ctrl + u)得到的页面完全不同。
谁能告诉我如何获得确切的源页面。或者期望两个页面相等是错误的?
非常感谢
虽然 html 可以从 Internet 上正确检索,但使用 Web 浏览器可能很简单。该代码将要求您调用另一个 void 或将代码放在事件中。
WebBrowser wb = new WebBrowser();
private void button1_Click(object sender, EventArgs e) {
wb.Navigate("http://kissanime.com/Anime/One-Piece");
wb.ScriptSupress = true;
wb.DocumentCompleted += pageLoaded;
}
private void pageLoaded(object sender, WebBrowserDocumentCompletedEventArgs e) {
string src = wb.DocumentText;
}
通过使用该方法,您将 html 直接从 Web 浏览器中获取,但加载可能需要一些时间,具体取决于页面大小、图像和依赖项(外部文件,如 JS、CSS 和 Pictures/Videos).
我正在尝试使用 C# 应用程序提取给定 URL 的源页面。现在我正在使用 class HttpWebRequest
。
奇怪的是,从这个class得到的结果页面与用Google Chrome浏览器(Ctrl + u)得到的页面完全不同。
谁能告诉我如何获得确切的源页面。或者期望两个页面相等是错误的?
非常感谢
虽然 html 可以从 Internet 上正确检索,但使用 Web 浏览器可能很简单。该代码将要求您调用另一个 void 或将代码放在事件中。
WebBrowser wb = new WebBrowser();
private void button1_Click(object sender, EventArgs e) {
wb.Navigate("http://kissanime.com/Anime/One-Piece");
wb.ScriptSupress = true;
wb.DocumentCompleted += pageLoaded;
}
private void pageLoaded(object sender, WebBrowserDocumentCompletedEventArgs e) {
string src = wb.DocumentText;
}
通过使用该方法,您将 html 直接从 Web 浏览器中获取,但加载可能需要一些时间,具体取决于页面大小、图像和依赖项(外部文件,如 JS、CSS 和 Pictures/Videos).