pytesseract 无法识别图像中的数字,
pytesseract can't recognise digits from a image,
我要分析的图像如下:
我是运行这个代码:
from PIL import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'
my_image = 'C:\autobot_wwe_supercard\imagenes\codigo_arriba.png'
text = pytesseract.image_to_string(Image.open(my_image))
print(text)
给我的结果是:
我已经使用 pip install pytesseract 通过控制台安装了 pytesseract。
pytesseract 不是最佳选择。裁剪感兴趣区域时尝试在文本周围添加一些填充。
>>> img = cv2.imread("1299.png")
>>> gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
>>> thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)[1]
>>> thresh = 255 - thresh
>>> data = pytesseract.image_to_string(thresh, config='--psm 11 digits')
>>> data
'1299'
>>>
尝试在配置中将数字列入白名单。
pytesseract 有时也能够在黑色背景上提取白色文本。
我要分析的图像如下:
我是运行这个代码:
from PIL import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'
my_image = 'C:\autobot_wwe_supercard\imagenes\codigo_arriba.png'
text = pytesseract.image_to_string(Image.open(my_image))
print(text)
给我的结果是:
我已经使用 pip install pytesseract 通过控制台安装了 pytesseract。
pytesseract 不是最佳选择。裁剪感兴趣区域时尝试在文本周围添加一些填充。
>>> img = cv2.imread("1299.png")
>>> gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
>>> thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)[1]
>>> thresh = 255 - thresh
>>> data = pytesseract.image_to_string(thresh, config='--psm 11 digits')
>>> data
'1299'
>>>
尝试在配置中将数字列入白名单。 pytesseract 有时也能够在黑色背景上提取白色文本。