在 windows 上开始使用 Python OCR?
Getting started with Python OCR on windows?
我以前从未使用过python,我不知道从哪里开始。我的目标是获取数字和彩色背景的图像数据,并可靠地识别出正确的字符。我研究了为此所需的工具,并找到了 Anaconda python 发行版,其中包含我可能需要的所有可能的软件包,以及 tesseract-ocr 和 pytesser。
不幸的是,我不知道如何开始。我正在使用 PyCharm 社区 IDE 并尝试遵循本指南:
http://www.manejandodatos.es/2014/11/ocr-python-easy/
掌握 OCR。
这是我正在使用的代码:
from PIL import Image
from pytesser import *
image_file = 'menu.jpg'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text
我相信我使用的 Anaconda 发行版有 PIL,但我收到了这个错误:
C:\Users\diego_000\Anaconda\python.exe C:/Users/diego_000/PycharmProjects/untitled/test.py
Traceback (most recent call last):
File "C:/Users/diego_000/PycharmProjects/untitled/test.py", line 2, in <module>
from pytesser import *
File "C:\Users\diego_000\PycharmProjects\untitled\pytesser.py", line 6, in <module>
import Image
ImportError: No module named Image
Process finished with exit code 1
谁能指出我正确的方向?
您指向的文档说要使用
from PIL import Image
除非你使用
import Image
所以口译员正确地说:
ImportError: No module named Image
看起来你重新排序了行
from PIL import Image
from pytesser import *
而且 pytesser 对 PIL 的编码依赖性不正确。但我不能确定你提供的代码。
我以前从未使用过python,我不知道从哪里开始。我的目标是获取数字和彩色背景的图像数据,并可靠地识别出正确的字符。我研究了为此所需的工具,并找到了 Anaconda python 发行版,其中包含我可能需要的所有可能的软件包,以及 tesseract-ocr 和 pytesser。
不幸的是,我不知道如何开始。我正在使用 PyCharm 社区 IDE 并尝试遵循本指南: http://www.manejandodatos.es/2014/11/ocr-python-easy/ 掌握 OCR。
这是我正在使用的代码:
from PIL import Image
from pytesser import *
image_file = 'menu.jpg'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text
我相信我使用的 Anaconda 发行版有 PIL,但我收到了这个错误:
C:\Users\diego_000\Anaconda\python.exe C:/Users/diego_000/PycharmProjects/untitled/test.py
Traceback (most recent call last):
File "C:/Users/diego_000/PycharmProjects/untitled/test.py", line 2, in <module>
from pytesser import *
File "C:\Users\diego_000\PycharmProjects\untitled\pytesser.py", line 6, in <module>
import Image
ImportError: No module named Image
Process finished with exit code 1
谁能指出我正确的方向?
您指向的文档说要使用
from PIL import Image
除非你使用
import Image
所以口译员正确地说:
ImportError: No module named Image
看起来你重新排序了行
from PIL import Image
from pytesser import *
而且 pytesser 对 PIL 的编码依赖性不正确。但我不能确定你提供的代码。