Pytesseract 设置字符白名单
Pytesseract set character whitelist
有谁知道怎么给Pytesseract设置字符白名单?我希望它只输出 A-z 和 0-9。这可能吗?我有以下内容:
img = Image.open('test.jpg')
result = pytesseract.image_to_string(img, config='-psm 6')
我得到其他字符,例如 / 表示 1,所以我想限制可能字符的选项。
您可以使用以下行来完成。或者你可以设置 tesseract 的配置文件来做同样的事情 Limit characters tesseract is looking for
pytesseract.image_to_string(question_img, config="-c tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz -psm 6")
我相信还有其他方法可以让它发挥作用,但这对我有用。
有谁知道怎么给Pytesseract设置字符白名单?我希望它只输出 A-z 和 0-9。这可能吗?我有以下内容:
img = Image.open('test.jpg')
result = pytesseract.image_to_string(img, config='-psm 6')
我得到其他字符,例如 / 表示 1,所以我想限制可能字符的选项。
您可以使用以下行来完成。或者你可以设置 tesseract 的配置文件来做同样的事情 Limit characters tesseract is looking for
pytesseract.image_to_string(question_img, config="-c tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz -psm 6")
我相信还有其他方法可以让它发挥作用,但这对我有用。