Python-tesseract 不识别任何东西

Python-tesseract does not recognize anything

这是我要导入的图片

我的python代码

try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract

print(pytesseract.image_to_string(Image.open('/home/milenko/Pictures/Screenshot from 2018-03-06 19-03-19.png')))

当我运行代码

python a72.py 

作为空输出 line.It 没有任何意义。 为什么?

尝试稍微调整一下您的命令,例如:other Page Segmentation Method 如您所见,默认值为 "Fully automatic page segmentation, but no OSD.",因此它不会执行方向和脚本检测 (OSD)。

这个给了我一些输出:

print(pytesseract.image_to_string(Image.open('image.png'), config='-psm 12'))

您可以使用 OpenCV 为 OCR 准备此图像,例如:

#!/usr/bin/python

import cv2 as cv
import numpy as np
import pytesseract
import Image

from matplotlib import pyplot as plt

img = cv.imread('/tmp/image.png',0)
ret,thresh = cv.threshold(img, 220, 255, cv.THRESH_BINARY)

plt.axis('off')
plt.imshow(thresh, 'gray')
plt.show()

print(pytesseract.image_to_string(thresh, config='-psm 12'))

在下一步中,您可以将此图像分成一些部分(x-axis、y-axis、趋势线)并分别对每个部分使用 OCR,并为每个部分设置适当的 PSM 值他们。