Python 请求获取 XML
Python Requests Get XML
如果我去 http://boxinsider.cratejoy.com/feed/ 我可以看到 XML 就好了。但是当我尝试使用 python 请求访问它时,出现 403 错误。
blog_url = 'http://boxinsider.cratejoy.com/feed/'
headers = {'Accepts': 'text/html,application/xml'}
blog_request = requests.get(blog_url, timeout=10, headers=headers)
有什么想法吗?
因为它由 WPEngine 托管并且他们会过滤用户代理。
试试这个:
USER_AGENT = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.152 Safari/537.36"
requests.get('http://boxinsider.cratejoy.com/feed/', headers={'User-agent': USER_AGENT})
如果我去 http://boxinsider.cratejoy.com/feed/ 我可以看到 XML 就好了。但是当我尝试使用 python 请求访问它时,出现 403 错误。
blog_url = 'http://boxinsider.cratejoy.com/feed/'
headers = {'Accepts': 'text/html,application/xml'}
blog_request = requests.get(blog_url, timeout=10, headers=headers)
有什么想法吗?
因为它由 WPEngine 托管并且他们会过滤用户代理。
试试这个:
USER_AGENT = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.152 Safari/537.36"
requests.get('http://boxinsider.cratejoy.com/feed/', headers={'User-agent': USER_AGENT})