为 OCR 优化图像

Optimize image for OCR

我在开发使用 Tesseract 的应用程序时遇到了一些问题。问题是我似乎找不到足够快的方法来使图像适合快速 OCR 扫描。任何人都可以指出一个更快的方法/一个现有的库，我可以用它来使事情发生得更快吗？

尝试使用OpenCV函数：adaptiveThreshold(..., CV_ADAPTIVE_THRESH_MEAN_C,...)。它工作得很快。
您可以使用更好的二值化算法（例如：SAUVOLA）。但它比 Mean 的二值化工作慢。查看来源：https://github.com/benob/opencv-utils/blob/master/include/binarize.h

我想 Tesseract 对你来说还不够。可能，解决您的问题的最佳方法是您自己的快速 OCR 解决方案。特别是，您需要加快 OCR 中的这些步骤：去歪斜、裁剪、二值化、查找连通分量、符号识别和文本 post-处理。

通常OCR中最长的操作是符号识别。我想让它更快你可以应用 GPGPU。

在开始自己的 OCR 实验之前，您可以先了解一下收据识别研究的回顾：http://rnd.azoft.com/applying-ocr-technology-receipt-recognition/
可能对你有帮助。