Tesseract 日期识别

Tesseract Recognition of dates

Date

您好,我正在尝试使用 Tesseract 识别收据中的日期。此代码可以很好地提取收据上的总额,但似乎不适用于日期,因为它打印出来的是空的。 我在这里缺少什么才能让它工作?

这是我的代码:

from PIL import Image
import pytesseract
img = Image.open('Rec.jpg')
print(pytesseract.image_to_string(img, config='-psm 6'))

尝试使用 tesseract 命令行 psm 设置为 12 并得到正确的日期 08/21/2017.

--psm 12表示为Sparse text with OSD设置segmentation mode

您可以使用命令tesseract --help找出tesseract v4.00.00alpha支持的--psm,用于测试。

希望这对您有所帮助。