Python:为 Windows 7 安装 Tesseract
Python: Install Tesseract for Windows 7
我的 objective 是在 Python 2.7 中使用 OCR,在 Windows 7 机器上使用 Tesseract,但我 运行 遇到安装过程的问题。我尝试按照 的说明进行操作,但是 link 到 "tesseract-core-yyyymmdd.exe" 和 "tesseract-langs-yyyymmdd.exe" 不再存在,而且我在网上其他地方也找不到这些 .exe。这是我到目前为止所做的:
- 从官方 tesseract-ocr 页面的可执行文件安装了 tesseract。
- 通过 pip 包安装 "wand"、"PIL"、"pyocr"。
现在,如果我在 Python 中执行以下操作:
from wand.image import Image
from PIL import Image as PI
import pyocr
import pyocr.builders
import io
加载这些包没有问题,但 pyocr.get_available_tools()
给了我一个空列表。我确信这与上面缺少的安装 .exe 文件有关。我在哪里可以找到它们?我还缺少其他东西吗?
我刚刚尝试设置 pytesseract 并且它有效!我安装了 windows 10 和 python 2.7。
您需要做的就是:
- 从 http://aka.ms/vcpython27 下载 Visual basic C++ 并安装(常见安装步骤)
通过此 python 从 python 下载 tesseract link https://pypi.python.org/pypi/pytesseract
解压缩文件。
转到包含解压缩文件的目录
运行 这个命令“python setup.py 安装”
(附加)要测试它是否已安装,请转到您的 python shell 和 运行 此命令“import pytesseract”
希望有用!!注意 pytesseract 是基于 google 的 OCR,它的工作原理与 tesseract 类似。
两者都安装完成
二进制文件来自:
https://github.com/UB-Mannheim/tesseract/wiki
Python 来自这里的包装器:
https://pypi.python.org/pypi/pytesseract
步骤 [1] 要安装 tesseract,请访问
https://github.com/UB-Mannheim/tesseract/wiki
最新的安装程序可以从这里下载:
例如、tesseract-ocr-setup-3.05.02-20180621.exe、tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe、 tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe(64 位)
步骤 [2] 从下面给出的 link 下载适用于 Python 2.7 的 Microsoft Visual C++ 编译器
https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi
步骤 [3] 安装 pytesseract 使用 pip[=14 绑定 tesseract =]
pip install pytesseract
步骤[4] 此外,您可以在python中安装图像处理库,例如pillow:
pip install pillow
您好!!你完成了! :)
PIP 是 Python 个包的包管理器
我的 objective 是在 Python 2.7 中使用 OCR,在 Windows 7 机器上使用 Tesseract,但我 运行 遇到安装过程的问题。我尝试按照
- 从官方 tesseract-ocr 页面的可执行文件安装了 tesseract。
- 通过 pip 包安装 "wand"、"PIL"、"pyocr"。
现在,如果我在 Python 中执行以下操作:
from wand.image import Image
from PIL import Image as PI
import pyocr
import pyocr.builders
import io
加载这些包没有问题,但 pyocr.get_available_tools()
给了我一个空列表。我确信这与上面缺少的安装 .exe 文件有关。我在哪里可以找到它们?我还缺少其他东西吗?
我刚刚尝试设置 pytesseract 并且它有效!我安装了 windows 10 和 python 2.7。
您需要做的就是:
- 从 http://aka.ms/vcpython27 下载 Visual basic C++ 并安装(常见安装步骤)
通过此 python 从 python 下载 tesseract link https://pypi.python.org/pypi/pytesseract
解压缩文件。
转到包含解压缩文件的目录
运行 这个命令“python setup.py 安装”
(附加)要测试它是否已安装,请转到您的 python shell 和 运行 此命令“import pytesseract”
希望有用!!注意 pytesseract 是基于 google 的 OCR,它的工作原理与 tesseract 类似。
两者都安装完成
二进制文件来自: https://github.com/UB-Mannheim/tesseract/wiki
Python 来自这里的包装器: https://pypi.python.org/pypi/pytesseract
步骤 [1] 要安装 tesseract,请访问
https://github.com/UB-Mannheim/tesseract/wiki
最新的安装程序可以从这里下载: 例如、tesseract-ocr-setup-3.05.02-20180621.exe、tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe、 tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe(64 位)
步骤 [2] 从下面给出的 link 下载适用于 Python 2.7 的 Microsoft Visual C++ 编译器 https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi
步骤 [3] 安装 pytesseract 使用 pip[=14 绑定 tesseract =]
pip install pytesseract
步骤[4] 此外,您可以在python中安装图像处理库,例如pillow:
pip install pillow
您好!!你完成了! :)
PIP 是 Python 个包的包管理器