无法从网页获取表单

Cannot get form from webpage

我正在尝试从以下位置获取登录表单:

https://www.etoro.com/login

当我在 Chrome 中检查时,我可以看到该元素,但是当我在 Java 中使用 jaunt api 时,我无法获取表格。

userAgent = new UserAgent();
userAgent.visit("https://etoro.com/login");
List<Form> forms = userAgent.doc.getForms();
System.out.println(forms.size()); // 0

我在HTML方面经验不足,所以任何方向都很好!

这是我的第一个 post 所以如果我做错了什么请告诉我。

非常感谢!

好吧,一个简单的 Java 网络抓取工具让你倒霉。

如果您在浏览器中查看该页面的源代码,您会发现该页面主要由一个长 <script> 组成。然后浏览器使用 Javascript.

创建整个登录表单

如果您绝对必须抓取这个确切的表格,您需要一个可以执行 Java脚本的工具。为此,您可以使用 PhantomJS。这基本上是一个完整的浏览器,可以用 Java 脚本 API.

控制

在 Google 中搜索 phantomjs web scraping 以开始使用。