如何通过 wget 或 curl 访问 https 页面?
How to access https page via wget or curl?
假设我想保存我的 Facebook 页面的内容。显然 fb 使用 https,因此使用 ssl,我如何使用 wget 下载安全页面的内容?
我在网上找到了很多资源...我修改了我的命令,但它没有保存我想要的页面。
wget --secure-protocol=auto "https://www.facebook.com/USERNAMEHERE" -O index.html
实际上这是我在 index.html 中得到的结果:
“更新您的浏览器
您正在使用 Facebook 不支持的网络浏览器。
要获得更好的体验,请访问这些站点之一并获取您首选浏览器的最新版本:"
问题不在于 SSL / https。问题是 facebook 将 "wget" 视为代理并告诉 "update your browser".
你必须用 --user-agent 开关来欺骗 facebook 并模仿现代浏览器。
wget --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" https://facebook.com/USERNAME -O index.html
如果您在现代浏览器中打开 index.html,您将看到实际的 Facebook 页面。
假设我想保存我的 Facebook 页面的内容。显然 fb 使用 https,因此使用 ssl,我如何使用 wget 下载安全页面的内容?
我在网上找到了很多资源...我修改了我的命令,但它没有保存我想要的页面。
wget --secure-protocol=auto "https://www.facebook.com/USERNAMEHERE" -O index.html
实际上这是我在 index.html 中得到的结果: “更新您的浏览器 您正在使用 Facebook 不支持的网络浏览器。 要获得更好的体验,请访问这些站点之一并获取您首选浏览器的最新版本:"
问题不在于 SSL / https。问题是 facebook 将 "wget" 视为代理并告诉 "update your browser".
你必须用 --user-agent 开关来欺骗 facebook 并模仿现代浏览器。
wget --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" https://facebook.com/USERNAME -O index.html
如果您在现代浏览器中打开 index.html,您将看到实际的 Facebook 页面。