使用 urllib2 跟随重定向
follow redirect using urllib2
我正在尝试使用 urllib2 来跟踪 url 的重定向。
>>> import urllib2
>>> page=urllib2.urlopen('http://acer.com')
>>> print page.geturl()
http://www.acer.com/worldwide/selection.html
>>>page=urllib2.urlopen('http://www.acer.com/worldwide/selection.html')
>>> print page.geturl()
http://www.acer.com/worldwide/selection.html
但是当我在浏览器中打开 http://www.acer.com/worldwide/selection.html
时,它会重定向到 http://us.acer.com/ac/en/US/content/home#_ga=1.216787925.232352975.1435019296
如何使用 urllib.
检测此重定向
get_url()
不适用于所有重定向(例如 JavaScript 重定向)
你想达到什么目的?
像 Selenium with PhantomJS 这样的后端可能更适合这个。
对于屏幕截图,您可以使用 save_screenshot()
,它是 Selenium Webdriver
的一部分
使用 selenium
开始。我使用 chromedriver 作为浏览器:
from selenium.webdriver import Chrome
cr = Chrome()
cr.get(url)
cr.save_screenshot('IMAGE_NAME.png')
我正在尝试使用 urllib2 来跟踪 url 的重定向。
>>> import urllib2
>>> page=urllib2.urlopen('http://acer.com')
>>> print page.geturl()
http://www.acer.com/worldwide/selection.html
>>>page=urllib2.urlopen('http://www.acer.com/worldwide/selection.html')
>>> print page.geturl()
http://www.acer.com/worldwide/selection.html
但是当我在浏览器中打开 http://www.acer.com/worldwide/selection.html
时,它会重定向到 http://us.acer.com/ac/en/US/content/home#_ga=1.216787925.232352975.1435019296
如何使用 urllib.
get_url()
不适用于所有重定向(例如 JavaScript 重定向)
你想达到什么目的?
像 Selenium with PhantomJS 这样的后端可能更适合这个。
对于屏幕截图,您可以使用 save_screenshot()
,它是 Selenium Webdriver
使用 selenium
开始。我使用 chromedriver 作为浏览器:
from selenium.webdriver import Chrome
cr = Chrome()
cr.get(url)
cr.save_screenshot('IMAGE_NAME.png')