无法从 HtmlUnit 获取正确的源
Can't get correct source from HtmlUnit
我正在尝试使用 htmlunit 获取 this 页面的源代码,但似乎某些 javascript 没有被执行(或者可能发生了其他事情)。它只 returns 在 "Loading..." 舞台上的页面在表格出现之前显示。我做错了什么吗?
我的代码:
[...] WebClient webClient = new WebClient(BrowserVersion.CHROME);
Page page = webClient.getPage(url);
WebResponse response = page.getWebResponse();
String content = response.getContentAsString();
System.out.println("HTML: " + content); [...]
页面。getWebResponse()
returns 从服务器收到的响应,没有 JavaScript 修改。
你应该使用:
page.asXml()
或
page.asText()
对于该页面,HtmlUnit 似乎通过了一个错误:
Invalid JavaScript value of type com.gargoylesoftware.htmlunit.ScriptException
我正在尝试使用 htmlunit 获取 this 页面的源代码,但似乎某些 javascript 没有被执行(或者可能发生了其他事情)。它只 returns 在 "Loading..." 舞台上的页面在表格出现之前显示。我做错了什么吗?
我的代码:
[...] WebClient webClient = new WebClient(BrowserVersion.CHROME);
Page page = webClient.getPage(url);
WebResponse response = page.getWebResponse();
String content = response.getContentAsString();
System.out.println("HTML: " + content); [...]
页面。getWebResponse()
returns 从服务器收到的响应,没有 JavaScript 修改。
你应该使用:
page.asXml()
或
page.asText()
对于该页面,HtmlUnit 似乎通过了一个错误:
Invalid JavaScript value of type com.gargoylesoftware.htmlunit.ScriptException