请求模块出现 TooManyRedirects 错误

TooManyRedirects Error with requests module

目前正在尝试为 url 获取 html,但遇到 python 中的请求模块引发的错误。

处理请求引发的 TooManyRedirects 错误的首选方法是什么?如何访问站点的html?

site = requests.get("http://www.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays")

禁止重定向的正常方法是使用 allow_redirects=False 例如,

site = requests.get(url,allow_redirects=False)

但这不是您问题的解决方案,

添加用户代理解决重定向问题并成功获取页面源。

试试这个,

headers={"User-Agent":"Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36"}

url="http://www.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays"

site = requests.get(url,headers=headers)    
print site.url

-

Out[]: 'http://hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays/'