PDF 文件头序列：为什么很多文档中使用 '25 e2 e3 cf d3' 位流？

PDF File header sequence: Why '25 e2 e3 cf d3' bits stream used in many document?

我知道通知 reader pdf 是否包含二进制文件。

但为什么“25 e2 e3 cf d3”不是随机二进制？因为很多文档都有那个。

难道只是因为这么多人使用相同的 pdf 库吗？

参考：

PDF format. function of %-started sequence

comp.text.pdf>pdf format

查看我这里的 PDF，似乎许多 PDF 处理器都使用这些字母“%âãÏÓ”，其中包括 Adobe 产品。

并非所有这些处理器都使用相同的基本 PDF 库，因此不能用类似的东西来解释相同字母的使用。

很可能是因为 Adobe 软件创建带有第二行注释的 PDF。多年来，其他软件的开发人员使用 Adobe 软件生成的示例文件作为他们创建的 PDF 的模板。

是的，规范 ISO 32000-1 仅要求

If a PDF file contains binary data, as most do (see 7.2, "Lexical Conventions"), the header line shall be immediately followed by a comment line containing at least four binary characters—that is, characters whose codes are 128 or greater.

（和更早的PDF参考也推荐相同），所以没有必要使用相同的二进制字符.

但是也没有理由不使用它们。为什么在这方面偏离 Adobe 软件生成的工作示例文件？

特别是在 ISO 规范出现之前的几年里，当只有 PDF 参考时，人们往往会在创建的文档结构中尽可能地像 Adobe 一样 as the PDF references were not considered normative in nature by Adobe。因此，如果您的文档在引用方面是有效的，Adobe 查看者仍然可以拒绝它而不会将其视为错误...

PDF 文件头序列：为什么很多文档中使用 '25 e2 e3 cf d3' 位流？

PDF File header sequence: Why '25 e2 e3 cf d3' bits stream used in many document?

pdf

file-format