为什么 render / requests-html 不抓取动态内容?
Why render / requests-html doesn't scrape dynamic content?
长话短说:从 Selenium 切换到 Requests(-html)。
工作正常,但并非在所有情况下。
页数:https://www.winamax.fr/paris-sportifs/sports/1/1/1
加载后,它会为英语游戏的动态内容收费(例如:谢菲尔德联队 - 西汉姆)。
但是当我尝试这样做时:
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.winamax.fr/paris-sportifs/1/1/1')
r.html.render()
print(r.html.text) # I also tried print(r.html.html)
输出中没有显示游戏。
为什么?谢谢!
添加超时,它应该工作,抱歉这必须是评论但我不能评论..
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.winamax.fr/paris-sportifs/sports/1/1/1')
r.html.render(timeout=20)
print(r.html.html)
session.close()
长话短说:从 Selenium 切换到 Requests(-html)。
工作正常,但并非在所有情况下。
页数:https://www.winamax.fr/paris-sportifs/sports/1/1/1
加载后,它会为英语游戏的动态内容收费(例如:谢菲尔德联队 - 西汉姆)。
但是当我尝试这样做时:
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.winamax.fr/paris-sportifs/1/1/1')
r.html.render()
print(r.html.text) # I also tried print(r.html.html)
输出中没有显示游戏。
为什么?谢谢!
添加超时,它应该工作,抱歉这必须是评论但我不能评论..
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.winamax.fr/paris-sportifs/sports/1/1/1')
r.html.render(timeout=20)
print(r.html.html)
session.close()