Pytesseract 设置字符白名单

Pytesseract set character whitelist

有谁知道怎么给Pytesseract设置字符白名单?我希望它只输出 A-z 和 0-9。这可能吗?我有以下内容:

img = Image.open('test.jpg')
result = pytesseract.image_to_string(img, config='-psm 6')

我得到其他字符,例如 / 表示 1,所以我想限制可能字符的选项。

您可以使用以下行来完成。或者你可以设置 tesseract 的配置文件来做同样的事情 Limit characters tesseract is looking for

pytesseract.image_to_string(question_img, config="-c tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz -psm 6")

我相信还有其他方法可以让它发挥作用,但这对我有用。