为什么 wget 向每个文件添加 html 扩展?
Why does wget add html exentions to every file?
我正在使用以下命令从服务器下载所有文件
wget -R "index.*" -m -np -e robots=off http://robotics.ethz.ch/~asl-datasets/ijrr_euroc_mav_dataset/
所有文件都被正确识别,但 wget 将 .html
添加到所有文件。例如:ijrr_euroc_mav_dataset/calibration_datasets/cam_april/cam_april.bag
变为 ijrr_euroc_mav_dataset/calibration_datasets/cam_april/cam_april.bag.html
这是为什么?
另外,wget 创建了我没有要求的文件夹 ~asl-datasets
。我只想下载 ijrr_euroc_mav_dataset
.
下面的所有文件
这是两个不同的问题,但很容易回答。 (我已经在评论中解决了这个问题,但回答是因为这显然是 spot-on 观察)。
首先是,Wget 为什么要为您的文件添加 .html
后缀。原因很可能是您的 ~/.wgetrc
文件中有 adjust-extensions
。由于显而易见的原因,此选项默认情况下被禁用,但在许多情况下很有用。尝试修改 ~/.wgetrc 文件或使用 --no-config
(或 --config=/dev/null
,如果使用的是大于 5 年的 Wget 版本)。
第二个问题是Wget为什么要创建一个目录。好吧,答案很简单。您要求镜像具有该目录的网站。您可以使用 --cut-dirs
选项来微调您希望 Wget 在磁盘上创建的目录。 (在你的情况下,我认为 --cut-dirs=2 --no-host-directories
可能是合适的,因为你不关心保留目录结构。但是请记住,这意味着不同目录中具有相同名称的文件可能会被覆盖
我正在使用以下命令从服务器下载所有文件
wget -R "index.*" -m -np -e robots=off http://robotics.ethz.ch/~asl-datasets/ijrr_euroc_mav_dataset/
所有文件都被正确识别,但 wget 将 .html
添加到所有文件。例如:ijrr_euroc_mav_dataset/calibration_datasets/cam_april/cam_april.bag
变为 ijrr_euroc_mav_dataset/calibration_datasets/cam_april/cam_april.bag.html
这是为什么?
另外,wget 创建了我没有要求的文件夹 ~asl-datasets
。我只想下载 ijrr_euroc_mav_dataset
.
这是两个不同的问题,但很容易回答。 (我已经在评论中解决了这个问题,但回答是因为这显然是 spot-on 观察)。
首先是,Wget 为什么要为您的文件添加 .html
后缀。原因很可能是您的 ~/.wgetrc
文件中有 adjust-extensions
。由于显而易见的原因,此选项默认情况下被禁用,但在许多情况下很有用。尝试修改 ~/.wgetrc 文件或使用 --no-config
(或 --config=/dev/null
,如果使用的是大于 5 年的 Wget 版本)。
第二个问题是Wget为什么要创建一个目录。好吧,答案很简单。您要求镜像具有该目录的网站。您可以使用 --cut-dirs
选项来微调您希望 Wget 在磁盘上创建的目录。 (在你的情况下,我认为 --cut-dirs=2 --no-host-directories
可能是合适的,因为你不关心保留目录结构。但是请记住,这意味着不同目录中具有相同名称的文件可能会被覆盖