如何通过 servlet 获取 html 看起来像在网络浏览器上的代码?
How to get html code that looks like on web browser by servlet?
我需要使用 JSoup 获取 html。
我现在有:
Document doc = Jsoup
.connect("http://~~~")
.get();
问题:动态网站、网络延迟加载图像、嵌套框架。
我无法获取所有资源,html 代码。
当我通过 jsoup 连接到站点时,该站点代码和资源 & html 不完整。
ex) 延迟加载图像:未完成代码 -> ~~/white.png
更改为完整代码 -> something.png
如何完成 html 在网络浏览器上看起来像的代码。
有人提到使用 httpClient 库。但我不知道我应该做什么。
您是否尝试过使用 HtmlUnit 框架? HtmlUnit 更适合 Web 应用程序单元测试自动化,JSoup 更适合 Web Scraping。
我需要使用 JSoup 获取 html。
我现在有:
Document doc = Jsoup
.connect("http://~~~")
.get();
问题:动态网站、网络延迟加载图像、嵌套框架。
我无法获取所有资源,html 代码。 当我通过 jsoup 连接到站点时,该站点代码和资源 & html 不完整。
ex) 延迟加载图像:未完成代码 -> ~~/white.png 更改为完整代码 -> something.png
如何完成 html 在网络浏览器上看起来像的代码。 有人提到使用 httpClient 库。但我不知道我应该做什么。
您是否尝试过使用 HtmlUnit 框架? HtmlUnit 更适合 Web 应用程序单元测试自动化,JSoup 更适合 Web Scraping。