无法从网页获取表单
Cannot get form from webpage
我正在尝试从以下位置获取登录表单:
当我在 Chrome 中检查时,我可以看到该元素,但是当我在 Java 中使用 jaunt api 时,我无法获取表格。
userAgent = new UserAgent();
userAgent.visit("https://etoro.com/login");
List<Form> forms = userAgent.doc.getForms();
System.out.println(forms.size()); // 0
我在HTML方面经验不足,所以任何方向都很好!
这是我的第一个 post 所以如果我做错了什么请告诉我。
非常感谢!
好吧,一个简单的 Java 网络抓取工具让你倒霉。
如果您在浏览器中查看该页面的源代码,您会发现该页面主要由一个长 <script>
组成。然后浏览器使用 Javascript.
创建整个登录表单
如果您绝对必须抓取这个确切的表格,您需要一个可以执行 Java脚本的工具。为此,您可以使用 PhantomJS。这基本上是一个完整的浏览器,可以用 Java 脚本 API.
控制
在 Google 中搜索 phantomjs web scraping
以开始使用。
我正在尝试从以下位置获取登录表单:
当我在 Chrome 中检查时,我可以看到该元素,但是当我在 Java 中使用 jaunt api 时,我无法获取表格。
userAgent = new UserAgent();
userAgent.visit("https://etoro.com/login");
List<Form> forms = userAgent.doc.getForms();
System.out.println(forms.size()); // 0
我在HTML方面经验不足,所以任何方向都很好!
这是我的第一个 post 所以如果我做错了什么请告诉我。
非常感谢!
好吧,一个简单的 Java 网络抓取工具让你倒霉。
如果您在浏览器中查看该页面的源代码,您会发现该页面主要由一个长 <script>
组成。然后浏览器使用 Javascript.
如果您绝对必须抓取这个确切的表格,您需要一个可以执行 Java脚本的工具。为此,您可以使用 PhantomJS。这基本上是一个完整的浏览器,可以用 Java 脚本 API.
控制在 Google 中搜索 phantomjs web scraping
以开始使用。