如何使用 Blink 抓取 javascript 调用加密或混淆 json 的网页?
How to use Blink to scrape webpages with javascript calling encrypted or obfuscated json?
从 Mr.Avik Sengupta youtube NLP 视频了解到:
a) HTTP.get(url) 不能用于抓取使用 javascript 调用加密或混淆的 json.
的网页
b) 这种情况下可以使用Blink
我是 Blink 的新手,在这方面找不到任何有用的东西documentation/exmple!
请指导我使用 Blink 抓取此类网页。
- 是JavaScript不是jsp
- 如果您是该主题的新手,请先尝试 Selenium(它应该可以通过 PyCall 工作)。有几个很棒的 Selenium 教程,通过它们可以理解 Web 驱动程序架构
- 一旦您有使用 Selenium 的经验,https://juliagizmos.github.io/Blink.jl/latest/communication/ 的 Blink 文档应该非常明显。您基本上需要导航到网页,而不是使用 JavaScript 来获取其元素。
- 最后但同样重要的是 - 对于此类项目,请始终检查在您的用例中抓取是否合法且合乎道德。
从 Mr.Avik Sengupta youtube NLP 视频了解到:
a) HTTP.get(url) 不能用于抓取使用 javascript 调用加密或混淆的 json.
的网页
b) 这种情况下可以使用Blink
我是 Blink 的新手,在这方面找不到任何有用的东西documentation/exmple!
请指导我使用 Blink 抓取此类网页。
- 是JavaScript不是jsp
- 如果您是该主题的新手,请先尝试 Selenium(它应该可以通过 PyCall 工作)。有几个很棒的 Selenium 教程,通过它们可以理解 Web 驱动程序架构
- 一旦您有使用 Selenium 的经验,https://juliagizmos.github.io/Blink.jl/latest/communication/ 的 Blink 文档应该非常明显。您基本上需要导航到网页,而不是使用 JavaScript 来获取其元素。
- 最后但同样重要的是 - 对于此类项目,请始终检查在您的用例中抓取是否合法且合乎道德。