为什么 tesseract 不接受配置?

Why is tesseract not accepting the config?

我试图让 tesseract 只识别数字,但无论我配置什么,它都会忽略它。 pytessseract 在版本 0.2.0 和 tesseract 在 4.00.00alpha

from PIL import Image

import pytesseract as tes
import glob

tes.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

a = glob.glob(r'C:\Users\Pascal\Desktop\visible\*.png')

for imgPath in a:
    casd = Image.open(imgPath).convert('L').point(lambda x: 0 if x < 200 else 255, '1')
    im = tes.image_to_string(casd, config='outputbase digits')
    print(im)

一些输出:

® 69 ® 0

® 69 ® 0

® ase® 0

®麻生素®0

digits 配置文件所依赖的功能在 Tesseract 4.0x 中被破坏。

https://github.com/tesseract-ocr/tesseract/issues/751