使用 Tesseract 进行手写识别

Using Tesseract for handwriting recognition

我只是想知道如果在表格中将大写字母都放在自己的小盒子里,tesseract 的手写识别准确度如何。

我知道你可以训练它在一定程度上识别你自己的笔迹,但我的问题是我需要在多个笔迹中使用它。谁能指出我正确的方向?

非常感谢。

简而言之,您必须训练 Tesseract 引擎来识别手写内容。看看这个link:

Tesseract handwriting with dictionary training

这就是 linked post 所说的:

It's possible to train tesseract to recognize handwriting. Here are the instructions: https://tesseract-ocr.github.io/tessdoc/Training-Tesseract

But don't expect very good results. Academics have typically gotten accuracy results topping out about 90%. Here are a couple references for words and numbers. So if your use case can deal with at least 1/10 errors, this might work for you.

这里还有一篇关于这个主题的很好的学术文章:

使用Tesseract识别手写文本注释 用于即时信息 (iJIT) 的开源 OCR 引擎