PDF 文件头序列:为什么很多文档中使用 '25 e2 e3 cf d3' 位流?

PDF File header sequence: Why '25 e2 e3 cf d3' bits stream used in many document?

我知道通知 reader pdf 是否包含二进制文件。

但为什么“25 e2 e3 cf d3”不是随机二进制?因为很多文档都有那个。

难道只是因为这么多人使用相同的 pdf 库吗?

参考:

PDF format. function of %-started sequence

comp.text.pdf>pdf format

查看我这里的 PDF,似乎许多 PDF 处理器都使用这些字母“%âãÏÓ”,其中包括 Adob​​e 产品。

并非所有这些处理器都使用相同的基本 PDF 库,因此不能用类似的东西来解释相同字母的使用。

很可能是因为 Adob​​e 软件创建带有第二行注释的 PDF。多年来,其他软件的开发人员使用 Adob​​e 软件生成的示例文件作为他们创建的 PDF 的模板。

是的,规范 ISO 32000-1 仅要求

If a PDF file contains binary data, as most do (see 7.2, "Lexical Conventions"), the header line shall be immediately followed by a comment line containing at least four binary characters—that is, characters whose codes are 128 or greater.

(和更早的PDF参考也推荐相同),所以没有必要使用相同的二进制字符.

但是没有理由不使用它们。为什么在这方面偏离 Adob​​e 软件生成的工作示例文件?

特别是在 ISO 规范出现之前的几年里,当只有 PDF 参考时,人们往往会在创建的文档结构中尽可能地像 Adob​​e 一样 as the PDF references were not considered normative in nature by Adobe。因此,如果您的文档在引用方面是有效的,Adobe 查看者仍然可以拒绝它而不会将其视为错误...