使用 Python 错误中的请求下载 .gz 文件

Question

如果有人能帮助我解决我遇到的这个问题，我将不胜感激。

我正在尝试使用请求库从 Internet 下载 .gz 文件。我之前已经成功使用lib获取解析到浏览器的xml数据，但是.gz版本不起作用。

在我的浏览器中单击 URL_To_Gzip link 后，.gz 文件会自动开始下载文件。 --> 所以 url 没问题，但只是直接指向文件。

我正在尝试在 python 2.7 中对此进行编码，这样我就可以处理它包含的文件和数据，但是我收到一条错误消息，我正在努力解决。

错误信息：

HTTPSConnectionPool(host=HOST_URL_TO_GZip, port=443): url 超过最大重试次数: URL_TO_GZip.gz (Caused by: [Errno 10060] A connection attempt failed because the connected一段时间后对方没有正确响应，或者建立连接失败，因为连接的主机没有响应）

import requests 

data = requests.get(url_to_gzip,proxies = {"http":proxy_url}) # Does not work data = #Does not work

data = requests.get(url_to_gzip,proxies = {"http":proxy_url}, stream = True) # Does not work

Errno 10060 上的信息表明错误与我的代理有关，因为无法建立连接。 --> 但我已经成功地使用这些来获取类似版本中的 xml 数据。

谢谢，

拉维

编辑

URL_TO_GZip.gz 文件是通过 https:// 而工作正常的 xml 文件是通过 http://，我认为这是我的问题的原因及其工作原理对于一个文件而不是另一个文件。

Answer 1

对于遇到此问题的任何其他人，我需要添加 auth =（用户名、密码）关键字来访问 HTTPS 站点 auth keyword。

使用 Python 错误中的请求下载 .gz 文件

Download .gz file using requests in Python Error

python

gzip

download

request