使用 wget 无法读取攻击性安全文件内容

Offensive-security files content is unreadable with wget

我正在尝试使用 wget 下载一些 URL。除了 link Offensive-Security-ICQ 和 www.offensive-security.com.

上的任何其他 link 之外,我得到的文件没有问题

我尝试了 Linux 和 Windows 并进行了多次试验和大量搜索,但没有成功。

我用这个命令"wget https://www.offensive-security.com/pwbonline/icq.html"

生成的文件显示了这个符号并且它是 ANSI 解码的

我该如何解决这个问题??

出于某种原因,服务器没有 return html 页面,而是它的压缩版本。你得到的文件被识别为gzip压缩数据:

$ file icq.html
icq.html: gzip compressed data, from Unix

因此,您只需解压即可获得正确的 html 页面。

服务器为什么这样做:不确定,但可能是某些默认设置保持原样,因此您可以更快地下载。

如何直接下载 html 内容:可能是通过发送一些普通的用户代理和 header,这样服务器就认为它是一个普通的 Web 浏览器来执行请求而不是下载工具。

这可以通过 wget 使用一些选项来完成,例如,这应该有效:

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" https://www.offensive-security.com/pwbonline/icq.html