为什么 wget 向每个文件添加 html 扩展?

Why does wget add html exentions to every file?

我正在使用以下命令从服务器下载所有文件

wget -R "index.*" -m -np -e robots=off http://robotics.ethz.ch/~asl-datasets/ijrr_euroc_mav_dataset/

所有文件都被正确识别,但 wget 将 .html 添加到所有文件。例如:ijrr_euroc_mav_dataset/calibration_datasets/cam_april/cam_april.bag 变为 ijrr_euroc_mav_dataset/calibration_datasets/cam_april/cam_april.bag.html

这是为什么?

另外,wget 创建了我没有要求的文件夹 ~asl-datasets。我只想下载 ijrr_euroc_mav_dataset.

下面的所有文件

这是两个不同的问题,但很容易回答。 (我已经在评论中解决了这个问题,但回答是因为这显然是 spot-on 观察)。

首先是,Wget 为什么要为您的文件添加 .html 后缀。原因很可能是您的 ~/.wgetrc 文件中有 adjust-extensions。由于显而易见的原因,此选项默认情况下被禁用,但在许多情况下很有用。尝试修改 ~/.wgetrc 文件或使用 --no-config(或 --config=/dev/null,如果使用的是大于 5 年的 Wget 版本)。

第二个问题是Wget为什么要创建一个目录。好吧,答案很简单。您要求镜像具有该目录的网站。您可以使用 --cut-dirs 选项来微调您希望 Wget 在磁盘上创建的目录。 (在你的情况下,我认为 --cut-dirs=2 --no-host-directories 可能是合适的,因为你不关心保留目录结构。但是请记住,这意味着不同目录中具有相同名称的文件可能会被覆盖