从网站下载文件(包括没有直接 link 的文件)的工具?

Tool to download files (including files without direct link) from website?

我一直在努力寻找从 URL 下载文件的解决方案,例如:https://.com//。我了解了 wget 并尝试了很多选项,但意识到它不会下载索引文件或任何类型中没有直接 link 的任何文件。

例如,我想从 https://somesites.com/myfolder/myfiles/ 下载所有内容。
假设在 "myfiles" 目录下有一个 index.html,许多 html 文件和几个目录都在索引中被引用和 linked,还有几个其他 html 文件,例如 sample123.html 和 sample456.html。

wget 命令成功下载所有,但 sample123.html 和 sample456.html 具有几乎大多数常见和众所周知的选项。

是否有任何其他工具可以抓取位于 https://somesites.com/myfolder/myfiles/ 中的所有文件,无论是否直接 link?

我也试过 lftp 对 http URL,但下载结果比 wget 文件少得多。

我为此查看了堆栈溢出,但推荐的命令是仅使用直接 link(通过 wget)下载文件的命令。

你想做的是不可能的,可能是一个安全问题。想象一下,例如,某人在文件夹中有一个包含一些敏感数据的文件,但该文件没有在任何地方列出。您正在寻求一种也可以下载该文件的工具。

如前所述,这是不可能的,这就是为什么禁用 HTTP 服务器中的目录列表作为安全选项始终是一个好建议,以防止您想要做的事情。