更改图像 DPI 以与 tesseract 一起使用

Changing image DPI for usage with tesseract

我正在做一个项目来识别名片中的文本并将它们映射到适当的 fields.I 我正在使用 opencv 处理图像 processing.I 需要将预处理后的图像提供给 Tesseract-OCR 引擎处理文本认可。This link 声明图像至少应具有 300.My 的 DPI 图像像素大小为 2560x1536，DPI 为 72。

如何将DPI提高到300？
也有人说，调整大小 image.How 可以优化我的图像大小以获得良好的 OCR 结果
Tesseract 在 DPI 至少为 300 dpi 的图像上效果最佳，因此调整图像大小可能会有好处。 'so' 意味着什么 here.What 调整图像大小和 DPI 之间的关系？

对于 OCR，真正重要的是分辨率像素。因为物理特征可以从小到大，与采集设备的 DPI 无关。

根据经验，3 像素左右的笔划宽度是一个好的开始。如果较低，调整大小可能没有帮助，因为信息丢失。如果高很多，运行时间可能过长（或者 OCR 函数没有被定制来处理它）。

如果存在不匹配，还要检查包是否不会根据其自己的笔画宽度假设和存储在 header 中的 DPI 信息尝试在内部调整大小。

更改图像 DPI 以与 tesseract 一起使用

Changing image DPI for usage with tesseract

ocr

opencv

tesseract

image-processing

dpi