pytesseract 无法识别图像中的数字，

Question

我要分析的图像如下：

我是运行这个代码：

from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'

my_image = 'C:\autobot_wwe_supercard\imagenes\codigo_arriba.png'
text = pytesseract.image_to_string(Image.open(my_image))

print(text)

给我的结果是：

我已经使用 pip install pytesseract 通过控制台安装了 pytesseract。

Answer 1

pytesseract 不是最佳选择。裁剪感兴趣区域时尝试在文本周围添加一些填充。

Answer 2

>>> img = cv2.imread("1299.png")
>>> gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
>>> thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)[1]
>>> thresh = 255 - thresh
>>> data = pytesseract.image_to_string(thresh, config='--psm 11 digits')
>>> data
'1299'
>>>

尝试在配置中将数字列入白名单。 pytesseract 有时也能够在黑色背景上提取白色文本。

pytesseract 无法识别图像中的数字，

pytesseract can't recognise digits from a image,

python

digits

python-tesseract