在 AFP 文件中搜索文本

Searching text inside AFP files

有人要求我将文件从 PDF 转换为 AFP,我使用 IBM afp 打印机驱动程序进行了管理。我想知道是否有一种方法可以在 afp 文件中进行搜索。我知道我可以在 pdf 文件上执行此操作,但我被要求交叉检查在其中搜索的转换文件。

将 370kb 的 pdf 文件转换为 11.5Mb 的 afp 文件是否有原因?它是否转换为图像? (这将澄清为什么我无法在其中搜索)

在一定程度上可以配置IBM AFP 打印机驱动程序。查看此手册页:Creating AFP Resources Using the IBM AFP Printer Drivers 了解更多详细信息。
确保 "Print Text as Graphics" 已关闭。

一些 AFP 查看器具有在 AFP 文件中进行文本搜索的功能。考虑 BTB Viewer(警告,它看起来过时得离谱)。

如果您希望开发自己的解决方案,请考虑通常在 AFP 文档中搜索文本很复杂,因为每个 "logical" 文本块都可以拆分为一系列 MO:DCA 文本指令, 每个单独定位。并且这些指令将是连续的并不是理所当然的。所以期待搜索多词字符串的问题。

"Conversion" PDF 转 AFP 是一个通用术语。这取决于您用于转换的软件以及用于转换的设置。例如,考虑嵌入图像。由于许多 AFP 设备不支持 I:OCA 的 JPEG 压缩,转换应用程序可能会将光栅图像转换为原始 24 位位图,这在文件大小方面效率低得离谱;一个 1000×1000 像素的无辜背景图像将占用高达 3Mb 的文件大小(而原始 JPEG 流可能是几十 kbytes)。

C 是您在 AFP PTX 记录中搜索字符串的最佳选择。但是,这取决于您如何将 PDF 转换为 AFP。如果您使用 IBM 打印驱动程序,它将光栅化文本。因此,您将无法搜索。

如果您的请求是一次性的,AFP Explorer 是最好的免费软件之一。 http://www.compulsivecode.com/project_afpexplorer.aspx

我们使用 COMPART CPMCOPY 和 CPMILL 将 POS 和 PDF 文件转换为 AFP。您将在其中使用 MFF 过滤器来获得所需的输出。不过是行货。