Python请求数据错误?

Python Requests Data Error?

我正在使用请求和 BeatifulSoup 从网页中检索和提取信息。

但是,当我调用requests.get(url)然后打印出文本结果时,它与我在网页上看到的'Inspect Element'不一样。 HTML 代码的多个部分丢失,一些标签在跨度中有 "Loading" 等

我怀疑这意味着 requests.get() 函数在页面完全加载之前从页面中提取数据。

有什么办法可以避免这种情况吗?

谢谢。

如评论中所述,您通过检查在浏览器中看到的是 HTML,它可能是用 javascript 呈现的。

您的代码:

requests.get(url)

是来自服务器的原始响应。 javascript 尚未呈现并为您提供了动态创建的 HTML。

如评论中所述,如果您需要您的程序呈现此页面,您可能想尝试 Selenium、PhantomJS、QT4 或 Ghost。

硒:https://pypi.python.org/pypi/selenium

PhantomJS:https://github.com/elias-winberg/phantomjs-python

幽灵:http://jeanphix.me/Ghost.py/

使用 QT4 抓取:https://impythonist.wordpress.com/2015/01/06/ultimate-guide-for-scraping-javascript-rendered-web-pages/