Tesseract tsv 输出不工作

Tesseract tsv output not working

我正在尝试在 Ubuntu 17.10 中从命令行执行 tesseract。我想要 .tsv 文件中的输出,因为我需要置信度。正如所解释的 here,我执行:

tesseract testing_img.png out tsv

但我收到以下错误:

read_params_file: Can't open tsv
Tesseract Open Source OCR Engine v3.05.00 with Leptonica

并且输出正确写入 out.txt 文件中。好像是把那个tsv参数读成一个文件来读,不知道为什么。

我已经从源代码编译了 Tesseract,因为我需要 Tesseract 3.05 才能将 .tsv 文件作为输出,所以我不能使用 Ubuntu 存储库中的版本,因为它有Tesseract 3.04.

我 运行 Ubuntu 17.10.

这里有一些关于我的 Tesseract 安装的信息:

$ tesseract --version
    tesseract 3.05.00
     leptonica-1.75.3
      libpng 1.6.34 : zlib 1.2.11

$ ls /usr/share/tesseract-ocr/tessdata/
    configs  eng.traineddata  ita.traineddata  osd.traineddata  pdf.ttf  tessconfigs

$ echo $TESSDATA_PREFIX
    /usr/share/tesseract-ocr/

我遇到了同样的问题,在我的例子中,目录

中有一个名为 tsv 的文件
/usr/share/tesseract-ocr/tessdata/configs

不见了。我从以下网址下载了 tesseract 的源代码:

https://github.com/tesseract-ocr/tesseract/archive/3.05.00.tar.gz

并替换了文件夹 configs 的内容。