OCR 图像预处理 - Tesseract

Image Preprocessing for OCR - Tessaract

很明显,这张图片很难看,因为它的清晰度很低,而且不是真实的文字。但是,使用这段代码,我没有检测到任何接近的东西:

import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
image_name = 'NedNoodleArms.jpg'
im = Image.open(image_name) 
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save(image_name)
text = pytesseract.image_to_string(Image.open(image_name))
print(text)

产出

, Mdfiaodfiamms

有什么想法吗?我的对比函数生成的图像是:

哪个好看?我没有大量的 OCR 经验。你会在这里推荐什么预处理?我已经尝试将图像的大小调整得更大,这有一点帮助但还不够,还有一堆来自 PIL 的不同过滤器。不过没有什么特别接近的

你说得对,tesseract 在高分辨率下效果更好,因此有时调整图像大小会有所帮助 - 但不要转换为 1 位。

我在转换为灰度时取得了很好的效果,使它变大了 3 倍,并使字母更亮一些:

>>> im = Image.open('j78TY.png')\
          .convert('L').resize([3 * _ for _ in im.size], Image.BICUBIC)\
          .point(lambda p: p > 75 and p + 100)
>>> pytesseract.image_to_string(im)
'NedNoodleArms'

检查this jupyter notebook