如何通过 servlet 获取 html 看起来像在网络浏览器上的代码?

How to get html code that looks like on web browser by servlet?

我需要使用 JSoup 获取 html。

我现在有:

Document doc = Jsoup
               .connect("http://~~~")
               .get();

问题:动态网站、网络延迟加载图像、嵌套框架。

我无法获取所有资源,html 代码。 当我通过 jsoup 连接到站点时,该站点代码和资源 & html 不完整。

ex) 延迟加载图像:未完成代码 -> ~~/white.png 更改为完整代码 -> something.png

如何完成 html 在网络浏览器上看起来像的代码。 有人提到使用 httpClient 库。但我不知道我应该做什么。

您是否尝试过使用 HtmlUnit 框架? HtmlUnit 更适合 Web 应用程序单元测试自动化,JSoup 更适合 Web Scraping。

看看这个:http://htmlunit.sourceforge.net/gettingStarted.html