使用 wget 无法读取攻击性安全文件内容
Offensive-security files content is unreadable with wget
我正在尝试使用 wget 下载一些 URL。除了 link Offensive-Security-ICQ 和 www.offensive-security.com.
上的任何其他 link 之外,我得到的文件没有问题
我尝试了 Linux 和 Windows 并进行了多次试验和大量搜索,但没有成功。
我用这个命令"wget https://www.offensive-security.com/pwbonline/icq.html"
生成的文件显示了这个符号并且它是 ANSI 解码的
我该如何解决这个问题??
出于某种原因,服务器没有 return html 页面,而是它的压缩版本。你得到的文件被识别为gzip压缩数据:
$ file icq.html
icq.html: gzip compressed data, from Unix
因此,您只需解压即可获得正确的 html 页面。
服务器为什么这样做:不确定,但可能是某些默认设置保持原样,因此您可以更快地下载。
如何直接下载 html 内容:可能是通过发送一些普通的用户代理和 header,这样服务器就认为它是一个普通的 Web 浏览器来执行请求而不是下载工具。
这可以通过 wget
使用一些选项来完成,例如,这应该有效:
wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" https://www.offensive-security.com/pwbonline/icq.html
我正在尝试使用 wget 下载一些 URL。除了 link Offensive-Security-ICQ 和 www.offensive-security.com.
上的任何其他 link 之外,我得到的文件没有问题我尝试了 Linux 和 Windows 并进行了多次试验和大量搜索,但没有成功。
我用这个命令"wget https://www.offensive-security.com/pwbonline/icq.html"
生成的文件显示了这个符号并且它是 ANSI 解码的
我该如何解决这个问题??
出于某种原因,服务器没有 return html 页面,而是它的压缩版本。你得到的文件被识别为gzip压缩数据:
$ file icq.html
icq.html: gzip compressed data, from Unix
因此,您只需解压即可获得正确的 html 页面。
服务器为什么这样做:不确定,但可能是某些默认设置保持原样,因此您可以更快地下载。
如何直接下载 html 内容:可能是通过发送一些普通的用户代理和 header,这样服务器就认为它是一个普通的 Web 浏览器来执行请求而不是下载工具。
这可以通过 wget
使用一些选项来完成,例如,这应该有效:
wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" https://www.offensive-security.com/pwbonline/icq.html