为 OCR 优化图像
Optimize image for OCR
我在开发使用 Tesseract 的应用程序时遇到了一些问题。问题是我似乎找不到足够快的方法来使图像适合快速 OCR 扫描。任何人都可以指出一个更快的方法/一个现有的库,我可以用它来使事情发生得更快吗?
- 尝试使用OpenCV函数:adaptiveThreshold(..., CV_ADAPTIVE_THRESH_MEAN_C,...)。它工作得很快。
- 您可以使用更好的二值化算法(例如:SAUVOLA)。但它比 Mean 的二值化工作慢。查看来源:https://github.com/benob/opencv-utils/blob/master/include/binarize.h
我想 Tesseract 对你来说还不够。可能,解决您的问题的最佳方法是您自己的快速 OCR 解决方案。特别是,您需要加快 OCR 中的这些步骤:去歪斜、裁剪、二值化、查找连通分量、符号识别和文本 post-处理。
通常OCR中最长的操作是符号识别。我想让它更快你可以应用 GPGPU。
在开始自己的 OCR 实验之前,您可以先了解一下收据识别研究的回顾:http://rnd.azoft.com/applying-ocr-technology-receipt-recognition/
可能对你有帮助。
我在开发使用 Tesseract 的应用程序时遇到了一些问题。问题是我似乎找不到足够快的方法来使图像适合快速 OCR 扫描。任何人都可以指出一个更快的方法/一个现有的库,我可以用它来使事情发生得更快吗?
- 尝试使用OpenCV函数:adaptiveThreshold(..., CV_ADAPTIVE_THRESH_MEAN_C,...)。它工作得很快。
- 您可以使用更好的二值化算法(例如:SAUVOLA)。但它比 Mean 的二值化工作慢。查看来源:https://github.com/benob/opencv-utils/blob/master/include/binarize.h
我想 Tesseract 对你来说还不够。可能,解决您的问题的最佳方法是您自己的快速 OCR 解决方案。特别是,您需要加快 OCR 中的这些步骤:去歪斜、裁剪、二值化、查找连通分量、符号识别和文本 post-处理。
通常OCR中最长的操作是符号识别。我想让它更快你可以应用 GPGPU。
在开始自己的 OCR 实验之前,您可以先了解一下收据识别研究的回顾:http://rnd.azoft.com/applying-ocr-technology-receipt-recognition/
可能对你有帮助。