数据安全问题 - 打印 PDF - "deleted" 信息被打印

Data Security Issue - Printing PDF - "deleted" information gets printed

问题

我在工作时收到了一份 pdf 文件,然后将其打印出来。在 pdf 文件中有几个可选字段,可以在其中输入信息,例如 "place of birth" 等。如果我在我的计算机上打开 pdf 文件,我可以看到一组输入信息 A(一个旅行请求,日期从这个2017 年)。

如果我在本地打印机上打印 pdf,打印的文档包含一组信息 B,例如包含 2015 年的旅行请求日期。 在我的计算机上打开文件时看不到此信息。 我已经能够多次重现错误。

为什么这是个问题?

似乎以前进入 pdf 的条目仍以某种方式存储在 pdf 中,这与打开 pdf 时可见的内容相反。打印时,打印机似乎只访问最旧的条目并打印它们。

这是一个潜在的数据隐私和安全漏洞,因为 pdf 文件似乎在没有人知道的情况下保存了所有以前的条目。

特别是在工作中,其中一些 pdf 包含银行帐户信息和其他身份相关信息。

问题

有没有人遇到过类似的问题或知道如何删除 pdf 中存储的不可见的旧信息?

UPDATE1:我无法在其他打印机上重现该错误。看来此错误是由特定打印机引起的。然而这些信息必须存在于PDF文件中,这就是我的问题的具体原因。

UPDATE2:根据接受的答案中的信息,我使用了程序 "PDF CHAIN" 并选择了选项 "drop XFA from document"。然后我再次保存了处理过的文档,并在同一台打印机上打印出来。 终于打印出了正确的信息。

猜测(无法看到原始文件的情况)PDF 包含可选内容或注释,其中包含用于打印和屏幕的不同字段数据。

如果您使用 PDF 使用者(例如 Acrobat)打开文件,那么您看到的是 'screen' 结果。根据您使用的消费者,它可能会将屏幕数据发送到打印机,或者用 'Print' 数据代替。

您认为有问题的打印机能够直接打印 PDF,您没有说明您是否正在打印 PDF 文件,或者您是否正在使用应用程序,也没有说明其他打印机是否是 PDF能不能。

我的猜测是,关于要打印的 'correct' 信息,在 2 个打印路径中的某处做出了不同的决定。

请注意,这 不是 意味着 PDF 'seems to save all previous entries without anyone knowing';这对于 PDF 文件来说是不可能的。

恶意 PDF 处理应用程序可以通过向 PDF 文件添加注释来执行此操作,但只有该应用程序能够检索它。

但是为了不同的目的可能会有多个不同类型的条目,如果它们不相同(因为用于编辑文件的工具)那么你会得到这样奇怪的结果。

请注意,如果这对您来说是一个问题,那么您可能不应该使用 PDF,但您可以通过对文档进行数字签名来缓解这个问题。签名的 PDF 文件包括用于验证文档未被篡改的方法(安全加密哈希)。当然,您不能在不重新签名的情况下编辑 PDF 文件。

哦,另一种可能性是 PDF 实际上是 XFA 表单;当 PDF 用户无法处理 XFA 表单时,文档的一部分可能是打印 'something' 的有效 PDF,但这与您在使用 XFA 处理器时看到的内容无关。

我的钱花在打印数据与屏幕数据不同的可选内容、AcroForm 字段或注释上。