Tesseract:版本 cf0b378 和版本 3.05.01 之间的不同行为
Tesseract : different behaviours between version cf0b378 and version 3.05.01
我最近将我的计算机从 PC 运行 Ubuntu 16.04 更改为 MacBook Pro Mac Os X 10.12.6。
我正在开发一个使用 tesseract (pytesseract 0.1.7) 和 opencv 3.3.0 自动提取身份证文本的程序。
我现在面临的问题是我的程序无法正常工作,我的 Mac 书中的 OCR 完全错误,我不明白为什么。我想知道我应该怎么做才能让它在 MacBook Pro 上像在 Ubuntu
上一样工作
配置:
Ubuntu 16.04:
tesseract 是从源构建的
$ tesseract --version
tesseract cf0b378
leptonica -1.74.1
libjpeg 8d (libjpeg-turbo 1.4.2): libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8
Mac图书 os X 10.12.6 :
通过 Homebrew 安装的 tesseract
$ tesseract --version:
tesseract 3.05.01
leptonica-1.74.4
libjpeg 9b : libpng 1.6.32 : libtiff 4.0.8 : zlib 1.2.8
例子
如果我尝试这张图片:
通过运行这个命令tesseract image.jpg stdout
使用 tesseract cf0b378 我得到:Gabo / M
使用 tesseract 3.05.01 我得到:GM"
我通过使用 --HEAD 选项构建 tesseract 解决了这个问题。
brew update
brew install tesseract --HEAD
现在我有 tesseract 4.00.00alpha 并且工作得很好。
此外,我刚刚在这里找到了这个答案:https://groups.google.com/forum/?utm_medium=email&utm_source=footer#!msg/tesseract-ocr/rdaG14IDVu8/RtihYxlOAQAJ
我最近将我的计算机从 PC 运行 Ubuntu 16.04 更改为 MacBook Pro Mac Os X 10.12.6。 我正在开发一个使用 tesseract (pytesseract 0.1.7) 和 opencv 3.3.0 自动提取身份证文本的程序。 我现在面临的问题是我的程序无法正常工作,我的 Mac 书中的 OCR 完全错误,我不明白为什么。我想知道我应该怎么做才能让它在 MacBook Pro 上像在 Ubuntu
上一样工作配置:
Ubuntu 16.04: tesseract 是从源构建的
$ tesseract --version tesseract cf0b378 leptonica -1.74.1 libjpeg 8d (libjpeg-turbo 1.4.2): libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8
Mac图书 os X 10.12.6 : 通过 Homebrew 安装的 tesseract
$ tesseract --version: tesseract 3.05.01 leptonica-1.74.4 libjpeg 9b : libpng 1.6.32 : libtiff 4.0.8 : zlib 1.2.8
例子
如果我尝试这张图片:
通过运行这个命令tesseract image.jpg stdout
使用 tesseract cf0b378 我得到:Gabo / M
使用 tesseract 3.05.01 我得到:GM"
我通过使用 --HEAD 选项构建 tesseract 解决了这个问题。
brew update
brew install tesseract --HEAD
现在我有 tesseract 4.00.00alpha 并且工作得很好。
此外,我刚刚在这里找到了这个答案:https://groups.google.com/forum/?utm_medium=email&utm_source=footer#!msg/tesseract-ocr/rdaG14IDVu8/RtihYxlOAQAJ