Ghostscript:转换 pdf,使每一页都是没有个人的单个图像 objects/text
Ghostscript: convert pdf such that every page is a single image without individual objects/text
我想转换包含图像和文本的多页 pdf,这样每一页都只是一个平面图像,没有单独的 objects/text 可以选择(需要不弄乱 pdf-->ppt 转换...)。不能搜索/复制文本是不够的(我试过-dNoOutputFonts
)。
这个命令对一些包含图像的页面做了我想要的,但对其他主要是文本的页面却没有(看起来 -dHaveTransparency=false
是这里的关键):
gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=/printer -dCompatibilityLevel=1.5 -dHaveTransparency=false -dFastWebView=true -sOutputFile=out_file.pdf in_file.pdf
这里有什么神奇的设置可以让所有页面都有这种行为? (理想情况下,同时保持高质量的输出并且不会过度增大文件大小;-))
我刚刚尝试了一个实验,结果很好,可能就是你想要的:
gs -sDEVICE=pdfimage8 -r600 -dNOPAUSE -sOutputFile=output.pdf input.pdf
根据需要试用 pdfimage24 和 pdfimage32 设备。这里有更多信息:https://www.ghostscript.com/doc/9.53.3/Devices.htm#PDFimage
我想转换包含图像和文本的多页 pdf,这样每一页都只是一个平面图像,没有单独的 objects/text 可以选择(需要不弄乱 pdf-->ppt 转换...)。不能搜索/复制文本是不够的(我试过-dNoOutputFonts
)。
这个命令对一些包含图像的页面做了我想要的,但对其他主要是文本的页面却没有(看起来 -dHaveTransparency=false
是这里的关键):
gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=/printer -dCompatibilityLevel=1.5 -dHaveTransparency=false -dFastWebView=true -sOutputFile=out_file.pdf in_file.pdf
这里有什么神奇的设置可以让所有页面都有这种行为? (理想情况下,同时保持高质量的输出并且不会过度增大文件大小;-))
我刚刚尝试了一个实验,结果很好,可能就是你想要的:
gs -sDEVICE=pdfimage8 -r600 -dNOPAUSE -sOutputFile=output.pdf input.pdf
根据需要试用 pdfimage24 和 pdfimage32 设备。这里有更多信息:https://www.ghostscript.com/doc/9.53.3/Devices.htm#PDFimage