Tesseract 无法正确识别我的图像

Tesseract cannot recognize my image correctly

我正在开发一个Android应用程序,它需要从网站识别验证码。

我利用 tess-two 识别验证码并按照 TrainingTesseract3 说明训练我自己的训练数据(使用 jTessBoxEditor 来纠正字符),但无法正确识别,甚至无法识别。

下面的TIFF图像是我用来训练我的Tesseract的,我收集了很多验证码并将它们合并成一个图像。

TIFF image

The image that I want to recognize

比如上图的预期结果应该是k8666,但实际结果只有66。

有人帮我吗?谢谢

我使用 tesseract-ocr 的 .NET 包装器尝试了您的图像 Tesseract-ocr .Net Wrapper by Charliesw

我得到了一些更好的结果,例如(K8EEE,K8656),我认为您必须增加文本字体并使其加粗,并且我将图像保存为 96DPI 分辨率的 tiff 格式以获得比我更好的结果。