Tesseract 和 OpenCV - 处理图像

Tesseract & OpenCV - Processing Image

我正在尝试处理我用 tesseract 记录的这张黑板图像,但运气不好。我考虑过进行预处理以帮助改善我们的结果,但不确定要调用什么方法。

这是我的图片:

这是 tesseract 命令,我是 运行:

convert 468.jpg  -bordercolor black -border 20x20 468-b.jpg
tesseract 468-b.jpg - -psm 11

请注意,它不必正确处理所有数学符号,但至少要得到 1 + 4 = 5,也许还有 2 x 12 = 24 x 1

我以前的照片仅使用这些命令就可以很好地工作。这是照片:

下面是它会吐出的结果:

I+I

2+2m

它并不完美,但比我以前得到的要好得多。如何改进新黑板图像的效果?我是否需要使用 OpenCV,如果需要,示例实现将非常非常有帮助

提前致谢

P.S。这是我在 Tesseracts GitHub 上提出的最初问题,它让我得到了更好的结果:

https://github.com/tesseract-ocr/tesseract/issues/468

tesseract 无法很好地识别手写图像。所以我认为你应该使用深度学习来识别手写图像。

这里有一些您感兴趣的教程。

https://www.tensorflow.org/versions/r0.12/tutorials/mnist/beginners/index.html#mnist-for-ml-beginners