无法使用 Tesseract 3.0.2.02 存档为 WIndows 编译 Tesseract API 示例

Can't Compile Tesseract API example for WIndows using Tesseract 3.0.2.02 archive

我正在考虑使用 Tesseract 来处理 PDF 文件,因此我想使用库而不是外部可执行文件。

我首先下载了完整的 Tesseract 源代码并着手构建它。遗憾的是,标准资源无法在非 Linux 平台上构建,就我而言 Windows。方法是有的,我也看了。

首先,VS2008 版本没有。我知道它需要 Leptonica,但我想我会在之后解决这个问题并尝试构建现有代码。失败 "fatal error C1083: Cannot open include file: 'allheaders.h': No such file or directory"。现阶段与 Leptonica 无关,它根本不起作用。

即使我能够克服它,我也必须构建 Leptonica,这需要使用 GNU 工具,因此需要安装 Cygwin,所以我放弃了。我有一个 MingW 安装,(我从来没有设法让 Cygwin 以可用的方式工作)但我还不够热衷于搞砸如此复杂和脆弱的构建。

所以我决定只使用某些好心人创建的预构建二进制文件。从 code.google.com 下载。现在我需要研究使用代码,所以下一个明显的步骤是 Tesseract API 示例,它声明它需要 "tesseract-ocr-3.02.02-win32-lib-include-dirs.zip",没问题,因为我现在已经有了。

关于 API 示例希望文件放置的位置没有真正的线索,但稍微弄乱一下就可以将它们放在适当的位置。按构建和 "fatal error C1083: Cannot open include file: 'allheaders.h': No such file or directory",就像尝试从源代码构建 Tesseract 一样......

确实没有这样的文件。

那么,这个文件在哪里?

好的,现在我看到 allheaders.h 是 Leptonica 的一部分。仍然让我想知道为什么 Tesseract 预建库要求我有可用的 Leptonica,我本以为它是内置的,但我想它不是。

前段时间我也努力让它在 windows 下工作,然后我找到了这个 git 存储库:https://github.com/charlesw/tesseract-vs2012

它包括所有需要的外部库(因为 Tesseract 需要 Leptonica,但 Leptonica 也需要外部库来处理不同的图像格式)并且在 vs 2013 上也能很好地工作。