pdftk:multistamp:[multistamp 后文件大小增加] 与 [由于 multistamp 添加的总文本] 看起来不合理

pdftk: multistamp: [File size increase after multistamp] vs [total text added due to multistamp] looks unreasonable

我有一个文件大小 7.5MB 和页数 4000

的 pdf

我想在底部添加页码。所以我有另一个页面 4000 的空白 pdf,底部只有页码。它的文件大小 2MB

现在使用 pdftk 选项 multistamp 我在底部添加页码

pdftk file_without_pagenumbers.pdf multistamp only_pagenumbers.pdf output file_with_pagenumbers.pdf

file_with_pagenumbers.pdf 的文件大小为 11MB。由于添加了页码,文件大小几乎增加了 4MB

我觉得由于页码增加的文字量不会超过 0.5MB 的价值。即 1 到 4000 个数字可能是另外 10 页文本。

因此,对于 text 的额外 10 pages,增加 4MB 文件大小对我来说似乎不合理

任何人都可以帮助我在使用 pdftk

时如何在 multistamp 之后减小文件大小

我觉得也不是没有道理。除了数字之外,每一页还有相当多的开销:headers、尺寸、字体选择、定位……每页很容易占用 200 字节,或接近 1MB。包括一种字体,这需要更多 space.

当您使用 pdftk 来覆盖文件时,您会得到更多的开销:现在您必须记录哪个页面去哪里、在哪个位置、如何缩放等等。同样,每页几个字节,但是当您有 4k 页时,它会显示。

你可能想知道怎么可能有一个 4k 页的 PDF 只有 7.5MB 大小。一旦页面的所有 headers 就位,就可以压缩文本内容,如果是简单的 text-only PDF,它会很好地压缩。

当然可以通过修改页面的内容直接将页码添加到每一页,这样会降低开销,也许每页 20 个字节,但是你将需要更多比 pdftk 更精确的工具,它需要开销才能通用。

也许中间立场是使用像 pdfjam 这样的工具,请参阅最近的这个问题:How to add footer to pdf with pdfjam or pdftk?