使用 python 中的 urllib 获取带有 FQDN 的 IPv6 URL
Use urllib in python to fetch IPv6 URL with FQDN
我想使用 urllib 获取 IPv6 页面。
使用方括号 IPv6 表示法,但我不知道如何(轻松地)说服 python 在我给它 FQDN 时执行 IPv6 请求
像下面的ip是:https://www.dslreports.com/whatismyip
from sys import version_info
PY3K = version_info >= (3, 0)
if PY3K:
import urllib.request as urllib
else:
import urllib2 as urllib
url = None
opener = urllib.build_opener()
opener.addheaders = [('User-agent',
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36")]
url = opener.open("http://[2607:fad0:3706:1::1000]/whatismyip", timeout=3)
content = url.read()
[更新:关于 Python 2 / Python 3 的这一行不再有效,因为问题已更新]
首先,您似乎使用了 Python 2. 这很重要,因为 urllib 模块已拆分为多个部分并在 Python 中重命名 3.
其次,您的代码片段似乎不正确:build_opener 不是 urllib 可用的函数。它在 urllib2 中可用。
因此,我假设您的代码实际上是以下代码:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent',
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36")]
url = opener.open("http://www.dslreports.com/whatismyip", timeout=3)
如果您的 DNS 解析器正确处理 IPv6 资源记录,并且如果您的操作系统是使用双栈 IPv4/IPv6 或单 IPv6-only 栈构建的,并且如果您有正确的 IPv6 网络路径 dslreports.com,这个 Python 程序将使用 IPv6 连接到 www.dslreports.com。因此,无需说服 python 进行 IPv6 请求。
我终于解决了我的问题。不是最优雅的方式,但它适合我。
阅读后:
Force requests to use IPv4 / IPv6
和
Python urllib2 force IPv4
我决定进行 DNS 查找,然后发送一个带有 FQDN 的主机 header 来抓取内容。 (虚拟主机需要主机 header)
这是丑陋的片段:
# Ugly hack to get either IPv4 or IPv6 response from server
parsed_uri = urlparse(server)
fqdn = "{uri.netloc}".format(uri=parsed_uri)
scheme = "{uri.scheme}".format(uri=parsed_uri)
path = "{uri.path}".format(uri=parsed_uri)
try:
ipVersion = ip_kind(fqdn[1:-1])
ip = fqdn
except ValueError:
addrs = socket.getaddrinfo(fqdn, 80)
if haveIPv6:
ipv6_addrs = [addr[4][0] for addr in addrs if addr[0] == socket.AF_INET6]
ip = "[" + ipv6_addrs[0] + "]"
else:
ipv4_addrs = [addr[4][0] for addr in addrs if addr[0] == socket.AF_INET]
ip = ipv4_addrs[0]
server = "{}://{}{}".format(scheme, ip, path)
url = urllib.Request(server, None, {'User-agent' : 'Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5'})
# Next line adds the host header
url.host = fqdn
content = urllib.urlopen(url).read()
这远非理想,它可能更干净,但对我有用。
在这里实现:https://github.com/SteveClement/ipgetter/tree/IPv6
这只是通过一个服务器列表,return 你的边界网关 ip,现在也在 IPv6 中。
我想使用 urllib 获取 IPv6 页面。 使用方括号 IPv6 表示法,但我不知道如何(轻松地)说服 python 在我给它 FQDN 时执行 IPv6 请求 像下面的ip是:https://www.dslreports.com/whatismyip
from sys import version_info
PY3K = version_info >= (3, 0)
if PY3K:
import urllib.request as urllib
else:
import urllib2 as urllib
url = None
opener = urllib.build_opener()
opener.addheaders = [('User-agent',
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36")]
url = opener.open("http://[2607:fad0:3706:1::1000]/whatismyip", timeout=3)
content = url.read()
[更新:关于 Python 2 / Python 3 的这一行不再有效,因为问题已更新]
首先,您似乎使用了 Python 2. 这很重要,因为 urllib 模块已拆分为多个部分并在 Python 中重命名 3.
其次,您的代码片段似乎不正确:build_opener 不是 urllib 可用的函数。它在 urllib2 中可用。
因此,我假设您的代码实际上是以下代码:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent',
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36")]
url = opener.open("http://www.dslreports.com/whatismyip", timeout=3)
如果您的 DNS 解析器正确处理 IPv6 资源记录,并且如果您的操作系统是使用双栈 IPv4/IPv6 或单 IPv6-only 栈构建的,并且如果您有正确的 IPv6 网络路径 dslreports.com,这个 Python 程序将使用 IPv6 连接到 www.dslreports.com。因此,无需说服 python 进行 IPv6 请求。
我终于解决了我的问题。不是最优雅的方式,但它适合我。
阅读后:
Force requests to use IPv4 / IPv6 和 Python urllib2 force IPv4
我决定进行 DNS 查找,然后发送一个带有 FQDN 的主机 header 来抓取内容。 (虚拟主机需要主机 header)
这是丑陋的片段:
# Ugly hack to get either IPv4 or IPv6 response from server
parsed_uri = urlparse(server)
fqdn = "{uri.netloc}".format(uri=parsed_uri)
scheme = "{uri.scheme}".format(uri=parsed_uri)
path = "{uri.path}".format(uri=parsed_uri)
try:
ipVersion = ip_kind(fqdn[1:-1])
ip = fqdn
except ValueError:
addrs = socket.getaddrinfo(fqdn, 80)
if haveIPv6:
ipv6_addrs = [addr[4][0] for addr in addrs if addr[0] == socket.AF_INET6]
ip = "[" + ipv6_addrs[0] + "]"
else:
ipv4_addrs = [addr[4][0] for addr in addrs if addr[0] == socket.AF_INET]
ip = ipv4_addrs[0]
server = "{}://{}{}".format(scheme, ip, path)
url = urllib.Request(server, None, {'User-agent' : 'Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5'})
# Next line adds the host header
url.host = fqdn
content = urllib.urlopen(url).read()
这远非理想,它可能更干净,但对我有用。
在这里实现:https://github.com/SteveClement/ipgetter/tree/IPv6 这只是通过一个服务器列表,return 你的边界网关 ip,现在也在 IPv6 中。