什么是 COSName.B?

What is COSName.B?

有时,我们会得到一些 PDF 文件,我们将其拆分成页面,结果页面会太大。检查页面后,每个页面都有一个 COSName.B 数组,即 "huge"

我环顾四周,但似乎无法定义这种类型的 COS 元素。在复制页面之前删除元素修复了我的文件大小问题,结果看起来不错(在我看来)但我很害怕,因为我不确定要删除什么。

有人知道我在哪里可以找到更多关于这个谜团的信息吗?

(复制自 PDF specification:)

An array that shall contain indirect references to all article beads appearing on the page. The beads shall be listed in the array in natural reading order.

您可以使用源代码下载中的 DrawPrintTextLocations.java 示例或主干快照 PDFDebugger(但不是 2.0 PDFDebugger 版本)使它们可见。您可以在这里下载: https://repository.apache.org/content/groups/snapshots/org/apache/pdfbox/pdfbox-debugger/3.0.0-SNAPSHOT/

是否删除这个取决于你想对结果PDF做什么。如果您想提取文本(或允许您的客户这样做),则不应删除它。