如何在 Windows 上安装 leptonica+tesseract 而没有 Visual Studio 在 Anaconda 中使用?
How to install leptonica+tesseract on Windows without Visual Studio to use in Anaconda?
我想从图像中执行文本识别,我想使用 Python。我安装了蟒蛇。现在我想安装 Tesseract 但我还需要安装 Leptonica。我在 windows 中没有找到任何明确的说明如何操作。对于 Leptonica,我不想安装 Visual Studio。
那么任何人都可以提供明确的说明如何在 Windows 上安装 leptonica 和 tesseract 而不 Visual Studio 在 anaconda 中使用吗?
谢谢
这是一组简单的步骤,使 tesseract 3.05 开发版本从 2016 年 4 月 22 日起在 windows 7 和 windows 8 台机器上工作:
1- 从官方 tesseract-ocr 页面的可执行文件安装 tesseract(windoes 版本 3.02 就足够了)
2- 从 http://domasofan.spdns.eu/tesseract/
下载 tesseract 3.05 开发版的以下两个文件
有2个exe文件:
- tesseract-核心-yyyymmdd.exe
没有语言数据的 Tesseract 核心应用程序
- tesseract-langs-yyyymmdd.exe
Tesseract 可用的所有语言数据。
(yyyymmdd表示年4位,月2位,日2位。)
该应用程序是便携式的,因此您可以将其安装在 U 盘或其他位置。
sub 安装这些步骤:
- 下载 tesseract-core 和 tesseract-langs 包。
- 双击 tesseract-core 包并将其解压缩到您想要的目录(一个名为 "Tess_temp" 的临时新文件夹)。
双击tesseract-langs包解压到同一目录,但在上面的"Tess_temp"文件夹中添加\tessdata。
例如,如果我将 tesseract-core 提取到 c:\Tess_temp,tesseract-langs 需要转到 c:\Tess_temp\tessdata.
现在将 "Tess_temp" 中的所有内容复制到上面步骤 1 中安装 tesseract 3.02 的位置(通常位于 C:\Program Files (x86)\Tesseract-OCR)(将 3.02 材料替换为 3.05 )
它现在应该可以在 windows 上使用 3.05 版本。
将示例图像 test.png(带文本)复制到此 tesseract-ocr 文件夹并打开 cmd 并输入以下命令:
转到 tesseract 文件夹:cd C:\Program Files <x86>\Tesseract-OCR
运行 test.png 上的超正方体:tesseract -l eng test.png test_text -psm 6
它会告诉你
Tesseract Open Source OCR Engine v3.05.00dev with Leptonica
恭喜! (检查 test_txt.txt 提取的文本)
我想从图像中执行文本识别,我想使用 Python。我安装了蟒蛇。现在我想安装 Tesseract 但我还需要安装 Leptonica。我在 windows 中没有找到任何明确的说明如何操作。对于 Leptonica,我不想安装 Visual Studio。 那么任何人都可以提供明确的说明如何在 Windows 上安装 leptonica 和 tesseract 而不 Visual Studio 在 anaconda 中使用吗? 谢谢
这是一组简单的步骤,使 tesseract 3.05 开发版本从 2016 年 4 月 22 日起在 windows 7 和 windows 8 台机器上工作:
1- 从官方 tesseract-ocr 页面的可执行文件安装 tesseract(windoes 版本 3.02 就足够了)
2- 从 http://domasofan.spdns.eu/tesseract/
下载 tesseract 3.05 开发版的以下两个文件有2个exe文件:
- tesseract-核心-yyyymmdd.exe 没有语言数据的 Tesseract 核心应用程序
- tesseract-langs-yyyymmdd.exe Tesseract 可用的所有语言数据。
(yyyymmdd表示年4位,月2位,日2位。)
该应用程序是便携式的,因此您可以将其安装在 U 盘或其他位置。
sub 安装这些步骤:
- 下载 tesseract-core 和 tesseract-langs 包。
- 双击 tesseract-core 包并将其解压缩到您想要的目录(一个名为 "Tess_temp" 的临时新文件夹)。
双击tesseract-langs包解压到同一目录,但在上面的"Tess_temp"文件夹中添加\tessdata。 例如,如果我将 tesseract-core 提取到 c:\Tess_temp,tesseract-langs 需要转到 c:\Tess_temp\tessdata.
现在将 "Tess_temp" 中的所有内容复制到上面步骤 1 中安装 tesseract 3.02 的位置(通常位于 C:\Program Files (x86)\Tesseract-OCR)(将 3.02 材料替换为 3.05 )
它现在应该可以在 windows 上使用 3.05 版本。 将示例图像 test.png(带文本)复制到此 tesseract-ocr 文件夹并打开 cmd 并输入以下命令:
转到 tesseract 文件夹:
cd C:\Program Files <x86>\Tesseract-OCR
运行 test.png 上的超正方体:
tesseract -l eng test.png test_text -psm 6
它会告诉你
Tesseract Open Source OCR Engine v3.05.00dev with Leptonica
恭喜! (检查 test_txt.txt 提取的文本)