假设您使用现代打印机写入并使用现代扫描仪从中读取,一张纸可以容纳多少数字信息?

How much digital information can a piece of paper hold, assuming you write to it with a modern printer and read from it with a modern scanner?

我意识到这是一个悬而未决的问题,所以为了澄清,我想要一个错误率接近替代存储介质错误率的答案。

灵感来自 this ad from the 90s

您 link 看到的广告似乎是在比较数据 CD 的容量与打印在纸上的 text 的容量。与文本相比,您可以在纸上更紧凑地存储数据,但让我们从这里开始。

假设我们谈论的是黑色、等宽、8 间距、每英寸 6 行的英文文本,没有边距。还假设我们为此目的选择了一种字体,我们应该能够通过现代高端激光打印机(1200x1200 DPI)打印此类文本,并通过现代扫描仪(也是 1200x1200 DPI)以接近零的错误读取它) 和 OCR 套件(记住我们必须选择一种对此友好的字体)。然后我们得到每平方英寸 48 个字符。粗略估计,there are around 200000 English words total. In ordinary usage, the average word length is around 5 letters,所以我们有大约 10 个单词。十个随机英文单词的组合数约为 20000010,接近 2176,因此通过该度量我们传达了大约 176 位每平方英寸。 (而且这是一个高估,因为 random 英文单词的平均长度接近 7.5 个字母。)

如果我们假设我们打印的不是英文文本,而是来自 128 个元素的任意字符,即使用任意数据的 base-128 编码,则增加到 336 位/英寸2。直到不是很密集。

但是那种密度就是80后。我们可以通过使打印非常小来容纳更多数据。我们将使用 2x2 binning 进行打印以使扫描返回更可靠,并缩小文本以适应 12 像素乘 10 像素的框。这给了我们每平方英寸 50 行 60 个字符,信息密度为 21000 位/in2.

那好多了,但仍然很差劲。我们可以通过查看单个像素而不是寻找一小组模式(字符字形)来获得更高的信息密度。假设我们分配所有像素的 10% 来支持像素阵列的准确定位和注册,我们仍然可以传输超过 320000 位/in2.

等等,还有更多!现在我们将所有像素的一小部分分配给支持像素阵列的注册,也许我们可以达到我们设备的完整 1200x1200 像素分辨率,从而达到大约 1.2M 位/英寸的信息密度2.

我们还没有完全完成。前面假设的是黑色打印,但高端设备可以以我们现在谈论的相同 1200x1200 分辨率打印和扫描彩色。如果我们假设三个颜色通道,并假设我们可以准确地解析每个通道的四个级别,那么我们的每个像素实际上都携带 12 位信息,使我们的密度达到大约 24M 位/in2.

我想这差不多是极限了。人们可能会通过假设更好的颜色分辨率将它推得更远一点,但即使假设可以准确地打印和读回 24 位颜色,我们仍然处于相同的数量级。一张 8.5 x 11 sheet 的纸,按上述方式边对边打印,可以准确传送大约 3 亿字节。

那与光学媒体相比如何呢?嗯,标准尺寸的光盘有大约 16 平方英寸的可用表面积。大容量 CD-ROM 在该区域提供大约 700M 字节。将其与您的广告进行比较确实强调了它对您的衡量方式有何影响。当然,这是一个不合时宜的比较。如果我们考虑在相同表面积内填充 128G 字节的四层 BDXL 磁盘,那么现在我们谈论的是纸张和光学介质之间面密度的千倍以上差异。