获取另一个域上的页面内容
Get Content of a page on another domain
我们想要获取另一个域中某个页面的 html 内容。存在以下注意事项:
1-登录页面有一个我不是机器人recaptcha。
2- iFrame 中的页面加载受到限制。
3- 由于跨域限制,无法使用 jQuery 获取或加载方法。
有了这些限制,是否可以开发一个爬虫甚至使用一些客户端代码来获取数据?
谢谢
实际上.. 没有
但是您可以借助后端服务器。
让服务器下载页面并发送给客户端。
这将解决与 CORS 限制相关的问题。
来到验证码部分,如果页面操作受到验证码的限制,那么您也无能为力。如果有那么简单,验证码就不会放在首位了。
我们想要获取另一个域中某个页面的 html 内容。存在以下注意事项: 1-登录页面有一个我不是机器人recaptcha。 2- iFrame 中的页面加载受到限制。 3- 由于跨域限制,无法使用 jQuery 获取或加载方法。
有了这些限制,是否可以开发一个爬虫甚至使用一些客户端代码来获取数据? 谢谢
实际上.. 没有
但是您可以借助后端服务器。 让服务器下载页面并发送给客户端。
这将解决与 CORS 限制相关的问题。
来到验证码部分,如果页面操作受到验证码的限制,那么您也无能为力。如果有那么简单,验证码就不会放在首位了。