Python:为 Windows 7 安装 Tesseract

Python: Install Tesseract for Windows 7

我的 objective 是在 Python 2.7 中使用 OCR,在 Windows 7 机器上使用 Tesseract,但我 运行 遇到安装过程的问题。我尝试按照 的说明进行操作,但是 link 到 "tesseract-core-yyyymmdd.exe" 和 "tesseract-langs-yyyymmdd.exe" 不再存在,而且我在网上其他地方也找不到这些 .exe。这是我到目前为止所做的:

  1. 从官方 tesseract-ocr 页面的可执行文件安装了 tesseract。
  2. 通过 pip 包安装 "wand"、"PIL"、"pyocr"。

现在,如果我在 Python 中执行以下操作:

from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io

加载这些包没有问题,但 pyocr.get_available_tools() 给了我一个空列表。我确信这与上面缺少的安装 .exe 文件有关。我在哪里可以找到它们?我还缺少其他东西吗?

我刚刚尝试设置 pytesseract 并且它有效!我安装了 windows 10 和 python 2.7。

您需要做的就是:

  1. http://aka.ms/vcpython27 下载 Visual basic C++ 并安装(常见安装步骤)
  2. 通过此 python 从 python 下载 tesseract link https://pypi.python.org/pypi/pytesseract

  3. 解压缩文件。

  4. 转到包含解压缩文件的目录

  5. 运行 这个命令“python setup.py 安装”

  6. (附加)要测试它是否已安装,请转到您的 python shell 和 运行 此命令“import pytesseract”

希望有用!!注意 pytesseract 是基于 google 的 OCR,它的工作原理与 tesseract 类似。

两者都安装完成

二进制文件来自: https://github.com/UB-Mannheim/tesseract/wiki

Python 来自这里的包装器: https://pypi.python.org/pypi/pytesseract

步骤 [1] 要安装 tesseract,请访问

https://github.com/UB-Mannheim/tesseract/wiki

最新的安装程序可以从这里下载: 例如、tesseract-ocr-setup-3.05.02-20180621.exe、tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe、 tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe(64 位)

步骤 [2] 从下面给出的 link 下载适用于 Python 2.7 的 Microsoft Visual C++ 编译器 https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi

步骤 [3] 安装 pytesseract 使用 pip[=14 绑定 tesseract =]

pip install pytesseract

步骤[4] 此外,您可以在python中安装图像处理库,例如pillow:

pip install pillow

您好!!你完成了! :)

PIP 是 Python 个包的包管理器

  1. 打开cmd 运行 pip search "pytesseract",可以看到最新版本
  2. 运行 pip install pytesseract 为最新版本或 pip install pytesseract==0.3.0 为您想要的版本。
  3. 在windowspythoncmd运行import pytesseract确定安装成功。