请求模块出现 TooManyRedirects 错误
TooManyRedirects Error with requests module
目前正在尝试为 url 获取 html,但遇到 python 中的请求模块引发的错误。
处理请求引发的 TooManyRedirects 错误的首选方法是什么?如何访问站点的html?
site = requests.get("http://www.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays")
禁止重定向的正常方法是使用 allow_redirects=False
例如,
site = requests.get(url,allow_redirects=False)
但这不是您问题的解决方案,
添加用户代理解决重定向问题并成功获取页面源。
试试这个,
headers={"User-Agent":"Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36"}
url="http://www.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays"
site = requests.get(url,headers=headers)
print site.url
-
Out[]: 'http://hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays/'
目前正在尝试为 url 获取 html,但遇到 python 中的请求模块引发的错误。
处理请求引发的 TooManyRedirects 错误的首选方法是什么?如何访问站点的html?
site = requests.get("http://www.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays")
禁止重定向的正常方法是使用 allow_redirects=False
例如,
site = requests.get(url,allow_redirects=False)
但这不是您问题的解决方案,
添加用户代理解决重定向问题并成功获取页面源。
试试这个,
headers={"User-Agent":"Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36"}
url="http://www.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays"
site = requests.get(url,headers=headers)
print site.url
-
Out[]: 'http://hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays/'