tesseract:ambiguity 个字符

tesseract:ambiguity in characters

我目前正在处理车牌 recognition.For 与我使用提取和预处理的字母数字字符图像训练 tesseract 的目的相同。

字母0,Q,D和B,8,歧义是occurring.I附上0,Q的图片,D.Kindly帮我看看do.I有什么已经使用了 unicharambigs 但没有 use.Is 因为我的 Q 训练图像较少?

您可以在将图像发送到 Tesseract 之前进行一些图像处理。你可以检查这个 link:

image processing to improve tesseract OCR accuracy

您还可以查看 Tesseract-Ocr GitHub 及其改进质量文档:

https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality

较少的培训可能是一个原因,但您也可以通过图像处理产生很大的不同。

另外,您可以查看其他车牌识别题:

Using tesseract to recognize license plates