Tesseract:版本 cf0b378 和版本 3.05.01 之间的不同行为

Tesseract : different behaviours between version cf0b378 and version 3.05.01

我最近将我的计算机从 PC 运行 Ubuntu 16.04 更改为 MacBook Pro Mac Os X 10.12.6。 我正在开发一个使用 tesseract (pytesseract 0.1.7) 和 opencv 3.3.0 自动提取身份证文本的程序。 我现在面临的问题是我的程序无法正常工作,我的 Mac 书中的 OCR 完全错误,我不明白为什么。我想知道我应该怎么做才能让它在 MacBook Pro 上像在 Ubuntu

上一样工作

配置:

例子 如果我尝试这张图片:

通过运行这个命令tesseract image.jpg stdout

使用 tesseract cf0b378 我得到:Gabo / M

使用 tesseract 3.05.01 我得到:GM"

我通过使用 --HEAD 选项构建 tesseract 解决了这个问题。

brew update
brew install tesseract --HEAD

现在我有 tesseract 4.00.00alpha 并且工作得很好。

此外,我刚刚在这里找到了这个答案:https://groups.google.com/forum/?utm_medium=email&utm_source=footer#!msg/tesseract-ocr/rdaG14IDVu8/RtihYxlOAQAJ