使用 wkhtmltopdf 拉取单个页面
Using wkhtmltopdf to pull individual pages
我正在尝试将 HTML 页面转换为文档,但它们都在单独的页面上,例如
http://www.website.co.uk/example/html5forwebkit.html?page=32
如果我运行标准命令我只得到一页,是否有一个快捷命令来提取我需要的每一页?有 450 页,我希望它们都在同一个 PDF 文件中
您可以做的是创建一个循环并使用 wkhtmltopdf
为每个页面制作一个 PDF,然后使用 pdfunite
.
将这些单独的 PDF 合并在一起
# Change the values to your liking
# ↓ ↓↓↓
for page in {1..450};do
wkhtmltopdf "http://www.website.co.uk/example/html5forwebkit.html?page=$page" page_$page.pdf
# Optional 'sleep' so that you dont end up DOSing the site
sleep 0.5
done
# Merge the PDFs into one
pdfunite page_*.pdf out.pdf
我正在尝试将 HTML 页面转换为文档,但它们都在单独的页面上,例如
http://www.website.co.uk/example/html5forwebkit.html?page=32
如果我运行标准命令我只得到一页,是否有一个快捷命令来提取我需要的每一页?有 450 页,我希望它们都在同一个 PDF 文件中
您可以做的是创建一个循环并使用 wkhtmltopdf
为每个页面制作一个 PDF,然后使用 pdfunite
.
# Change the values to your liking
# ↓ ↓↓↓
for page in {1..450};do
wkhtmltopdf "http://www.website.co.uk/example/html5forwebkit.html?page=$page" page_$page.pdf
# Optional 'sleep' so that you dont end up DOSing the site
sleep 0.5
done
# Merge the PDFs into one
pdfunite page_*.pdf out.pdf