使用 Tesseract 执行 OCR 时出错:read_params_file:无法打开 deu

Error performing OCR with Tesseract: read_params_file: Can't open deu

在指定用于执行 OCR 的语言包时,出现以下错误(对应于每个语言包):

read_params_file: Can't open deu

我使用了 wiki 中描述的命令:

tesseract test.tif out -1 deu

.traineddata文件位于tessdata下,TESSDATA_PREFIX设置为tessdata的父目录。该过程在没有给定语言信息的情况下默认运行。

我在 Windows10.

上安装了 Tesseract 3.05

命令应该是

tesseract test.tif out -l deu

用 "l" 代替“1”。

如果您的参数设置有任何问题,这是常见的响应。如果您添加一个未定义的参数 - 例如“1”,或者您以错误的顺序添加参数。

例如

如果添加 hocr 参数,则必须将其放在 -l 参数之后。在官方文档中没有使用 hocr 和 language 参数的情况。

错误:

PS C:\Users\Mememe\Desktop\tesseract> & 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe' 'C:\Users\mememe\Desktop\tesseract\img.jpg' out hocr -l deu
read_params_file: Can't open l
read_params_file: Can't open deu
Tesseract Open Source OCR Engine v4.00.00alpha with Leptonica

更好:

'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe' 'C:\Users\Mememe\Desktop\tesseract\img.jpg' out -l deu hocr
Tesseract Open Source OCR Engine v4.00.00alpha with Leptonica

因此,如果您有此错误检查:

  • 你的参数都定义好了吗? (检查帮助参数以获取所有可用参数的列表)
  • 所有参数的顺序是否正确? (祝你好运:))
  • 我定义的路径是否正确?是否有我应该仔细检查的点或空格?

如果这不起作用 - 请仔细检查。否则请随时在此处添加您的答案。

发生这种情况是因为 os 无法读取 tesseract 中的命令参数。在我遇到的情况下,我必须更新 OS 上的 'locale' 然后:

  • sudo add-apt-repository ppa: alex-p / tesseract-ocr
  • sudo apt-get 更新
  • sudo apt 升级

我的os是ubuntuUbuntu18.04