更改图像 DPI 以与 tesseract 一起使用

Changing image DPI for usage with tesseract

我正在做一个项目来识别名片中的文本并将它们映射到适当的 fields.I 我正在使用 opencv 处理图像 processing.I 需要将预处理后的图像提供给 Tesseract-OCR 引擎处理文本认可。This link 声明图像至少应具有 300.My 的 DPI 图像像素大小为 2560x1536,DPI 为 72。

对于 OCR,真正重要的是分辨率像素。因为物理特征可以从小到大,与采集设备的 DPI 无关。

根据经验,3 像素左右的笔划宽度是一个好的开始。如果较低,调整大小可能没有帮助,因为信息丢失。如果高很多,运行 时间可能过长(或者 OCR 函数没有被定制来处理它)。

如果存在不匹配,还要检查包是否不会根据其自己的笔画宽度假设和存储在 header 中的 DPI 信息尝试在内部调整大小。