7段OCR java应用

7 segment OCR java application

我从事这个项目已经几个月了,需要一些帮助。我正在尝试识别旧相机图像上的字符,该相机使用七段 LED 将帧号印在图像的右下角。问题是这些图像是人的,肤色与一些肤色较浅的图像混淆。但大多数情况下,传统 OCR 无法识别,我正在尝试使用 Tesseract,但未能成功编译应用程序,只是为了测试和训练它。我在这里问是否有其他人有类似的问题或知道 Tesseract 的替代品能够识别这些字符。最好是可训练的ocr。我的搜索结果为空。

大多数 OCR 在图像背景方面都有问题,因此您应该首先尝试先隔离文本。由于这是计算机渲染的文本,因此:

  1. 文字很可能出现在图像中的同一位置

    所以不用搜索了。

  2. 文本很可能总是使用相同的字体

    如果你有它,事情会变得容易很多,甚至可以使用简单的方法,如每像素比较或相关系数,结果比基于神经网络的分类更好。你也可以试试这个 simple OCR.

  3. 您可以检测文本的“准确”颜色,过滤掉所有其他颜色

    尝试检测文本是纯色还是透明(add/xor 到图像像素)。无论如何,在这之后检测文本像素应该不会太难。一旦您可以可靠地检测到文本像素,将其他所有内容涂黑,然后使用 OCR。