Image-to-Text 解码器
Image-to-Text Decoder
我想将下面的图片解码成文字:
我已经尝试使用 Tesseract OCR 来达到我的目的,但到目前为止我并不走运。
这是我的代码:
import pytesseract
import sys
import argparse
try:
import Image
except ImportError:
from PIL import Image
from subprocess import check_output
def resolve(path):
check_output(['C:\Program Files\ImageMagick-7.0.9-Q16\convert.exe', path, '-resample', '600', path])
return pytesseract.image_to_string(Image.open(path))
if __name__=="__main__":
argparser = argparse.ArgumentParser()
argparser.add_argument('path',help = 'image path at OCR')
args = argparser.parse_args()
path = args.path
print('Resolving the image...')
captcha_text = resolve(path)
print('Result: ',captcha_text)`
这是我的程序的输出:
C:\Users\Foussy\PycharmProjects_Imagedecoder>python main.py C:\Users\Foussy\Pictures70502--437826.jpeg
Resolving the image...
Result:
看来我的程序无法解码图片。我尝试解码带有更多 "obvious" 文本的图像,效果很好。我还尝试了其他几个此类验证码的示例,但均未成功。你建议我做什么?
最后,我想编写一个程序来自动解码图像,所以除非有可靠的方法自动修改图像这使得 Tesseract 兼容,我没有看到任何其他方法来解决这个问题。如果有人知道某个图书馆或其他东西......会有所帮助。
这个 python 库可能有帮助:https://pypi.org/project/captcha-solver/
示例:
from captcha_solver import CaptchaSolver
solver = CaptchaSolver('twocaptcha', api_key='2captcha.com API HERE')
raw_data = open('captcha.png', 'rb').read()
print(solver.solve_captcha(raw_data))
我想将下面的图片解码成文字:
我已经尝试使用 Tesseract OCR 来达到我的目的,但到目前为止我并不走运。
这是我的代码:
import pytesseract
import sys
import argparse
try:
import Image
except ImportError:
from PIL import Image
from subprocess import check_output
def resolve(path):
check_output(['C:\Program Files\ImageMagick-7.0.9-Q16\convert.exe', path, '-resample', '600', path])
return pytesseract.image_to_string(Image.open(path))
if __name__=="__main__":
argparser = argparse.ArgumentParser()
argparser.add_argument('path',help = 'image path at OCR')
args = argparser.parse_args()
path = args.path
print('Resolving the image...')
captcha_text = resolve(path)
print('Result: ',captcha_text)`
这是我的程序的输出:
C:\Users\Foussy\PycharmProjects_Imagedecoder>python main.py C:\Users\Foussy\Pictures70502--437826.jpeg
Resolving the image...
Result:
看来我的程序无法解码图片。我尝试解码带有更多 "obvious" 文本的图像,效果很好。我还尝试了其他几个此类验证码的示例,但均未成功。你建议我做什么?
最后,我想编写一个程序来自动解码图像,所以除非有可靠的方法自动修改图像这使得 Tesseract 兼容,我没有看到任何其他方法来解决这个问题。如果有人知道某个图书馆或其他东西......会有所帮助。
这个 python 库可能有帮助:https://pypi.org/project/captcha-solver/
示例:
from captcha_solver import CaptchaSolver
solver = CaptchaSolver('twocaptcha', api_key='2captcha.com API HERE')
raw_data = open('captcha.png', 'rb').read()
print(solver.solve_captcha(raw_data))