如何下载一个网站,包括链接以特定路径开头的所有文件
How to download a website including all files with links starting with a certain path
我想建立一个基于 Wordpress 模板样式的静态网站,Inovado。我使用以下命令使用 HTTrack(在 Linux 中)下载了网站:
httrack http://inovado.hellominti.com
生成的 index.html
包含多个样式表,例如:
<link rel='stylesheet' id='basic-css' href='http://inovado.hellominti.com/wp-content/themes/inovado/framework/css/basic.css?ver=1' type='text/css' media='all' />
这些链接是 'absolute' 到 http://inovado.hellominti.com
的链接。但是,我想将这些文件下载到本地目录,并相应地调整 index.html
文件。
我看到 httrack
有诸如 --get_files
之类的选项,它们似乎可以启用此功能,但我无法从文档中弄清楚如何操作。有任何想法吗? (如果可能的话,我也有兴趣用 wget
实现它)。
我发现 HTTrack 的递归选项是这样做的:httrack -r http://inovado.hellominti.com
。
(顺便说一下,我在 http://www.w3schools.com/bootstrap/bootstrap_theme_company.asp 找到了一个更简单的 bootstrap 模板)。
我想建立一个基于 Wordpress 模板样式的静态网站,Inovado。我使用以下命令使用 HTTrack(在 Linux 中)下载了网站:
httrack http://inovado.hellominti.com
生成的 index.html
包含多个样式表,例如:
<link rel='stylesheet' id='basic-css' href='http://inovado.hellominti.com/wp-content/themes/inovado/framework/css/basic.css?ver=1' type='text/css' media='all' />
这些链接是 'absolute' 到 http://inovado.hellominti.com
的链接。但是,我想将这些文件下载到本地目录,并相应地调整 index.html
文件。
我看到 httrack
有诸如 --get_files
之类的选项,它们似乎可以启用此功能,但我无法从文档中弄清楚如何操作。有任何想法吗? (如果可能的话,我也有兴趣用 wget
实现它)。
我发现 HTTrack 的递归选项是这样做的:httrack -r http://inovado.hellominti.com
。
(顺便说一下,我在 http://www.w3schools.com/bootstrap/bootstrap_theme_company.asp 找到了一个更简单的 bootstrap 模板)。