如何在 Windows 上安装 leptonica+tesseract 而没有 Visual Studio 在 Anaconda 中使用?

How to install leptonica+tesseract on Windows without Visual Studio to use in Anaconda?

我想从图像中执行文本识别,我想使用 Python。我安装了蟒蛇。现在我想安装 Tesseract 但我还需要安装 Leptonica。我在 windows 中没有找到任何明确的说明如何操作。对于 Leptonica,我不想安装 Visual Studio。 那么任何人都可以提供明确的说明如何在 Windows 上安装 leptonica 和 tesseract 而不 Visual Studio 在 anaconda 中使用吗? 谢谢

这是一组简单的步骤,使 tesseract 3.05 开发版本从 2016 年 4 月 22 日起在 windows 7 和 windows 8 台机器上工作:

1- 从官方 tesseract-ocr 页面的可执行文件安装 tesseract(windoes 版本 3.02 就足够了)

2- 从 http://domasofan.spdns.eu/tesseract/

下载 tesseract 3.05 开发版的以下两个文件

有2个exe文件:

  • tesseract-核心-yyyymmdd.exe 没有语言数据的 Tesseract 核心应用程序
  • tesseract-langs-yyyymmdd.exe Tesseract 可用的所有语言数据。

(yyyymmdd表示年4位,月2位,日2位。)

该应用程序是便携式的,因此您可以将其安装在 U 盘或其他位置。

sub 安装这些步骤:

  1. 下载 tesseract-core 和 tesseract-langs 包。
  2. 双击 tesseract-core 包并将其解压缩到您想要的目录(一个名为 "Tess_temp" 的临时新文件夹)。
  3. 双击tesseract-langs包解压到同一目录,但在上面的"Tess_temp"文件夹中添加\tessdata。 例如,如果我将 tesseract-core 提取到 c:\Tess_temp,tesseract-langs 需要转到 c:\Tess_temp\tessdata.

  4. 现在将 "Tess_temp" 中的所有内容复制到上面步骤 1 中安装 tesseract 3.02 的位置(通常位于 C:\Program Files (x86)\Tesseract-OCR)(将 3.02 材料替换为 3.05 )

  5. 它现在应该可以在 windows 上使用 3.05 版本。 将示例图像 test.png(带文本)复制到此 tesseract-ocr 文件夹并打开 cmd 并输入以下命令:

    转到 tesseract 文件夹:cd C:\Program Files <x86>\Tesseract-OCR

    运行 test.png 上的超正方体:tesseract -l eng test.png test_text -psm 6

它会告诉你

Tesseract Open Source OCR Engine v3.05.00dev with Leptonica

恭喜! (检查 test_txt.txt 提取的文本)