Tesseract tsv 输出不工作
Tesseract tsv output not working
我正在尝试在 Ubuntu 17.10 中从命令行执行 tesseract。我想要 .tsv
文件中的输出,因为我需要置信度。正如所解释的 here,我执行:
tesseract testing_img.png out tsv
但我收到以下错误:
read_params_file: Can't open tsv
Tesseract Open Source OCR Engine v3.05.00 with Leptonica
并且输出正确写入 out.txt
文件中。好像是把那个tsv
参数读成一个文件来读,不知道为什么。
我已经从源代码编译了 Tesseract,因为我需要 Tesseract 3.05 才能将 .tsv
文件作为输出,所以我不能使用 Ubuntu 存储库中的版本,因为它有Tesseract 3.04.
我 运行 Ubuntu 17.10.
这里有一些关于我的 Tesseract 安装的信息:
$ tesseract --version
tesseract 3.05.00
leptonica-1.75.3
libpng 1.6.34 : zlib 1.2.11
$ ls /usr/share/tesseract-ocr/tessdata/
configs eng.traineddata ita.traineddata osd.traineddata pdf.ttf tessconfigs
$ echo $TESSDATA_PREFIX
/usr/share/tesseract-ocr/
我遇到了同样的问题,在我的例子中,目录
中有一个名为 tsv
的文件
/usr/share/tesseract-ocr/tessdata/configs
不见了。我从以下网址下载了 tesseract 的源代码:
https://github.com/tesseract-ocr/tesseract/archive/3.05.00.tar.gz
并替换了文件夹 configs
的内容。
我正在尝试在 Ubuntu 17.10 中从命令行执行 tesseract。我想要 .tsv
文件中的输出,因为我需要置信度。正如所解释的 here,我执行:
tesseract testing_img.png out tsv
但我收到以下错误:
read_params_file: Can't open tsv
Tesseract Open Source OCR Engine v3.05.00 with Leptonica
并且输出正确写入 out.txt
文件中。好像是把那个tsv
参数读成一个文件来读,不知道为什么。
我已经从源代码编译了 Tesseract,因为我需要 Tesseract 3.05 才能将 .tsv
文件作为输出,所以我不能使用 Ubuntu 存储库中的版本,因为它有Tesseract 3.04.
我 运行 Ubuntu 17.10.
这里有一些关于我的 Tesseract 安装的信息:
$ tesseract --version
tesseract 3.05.00
leptonica-1.75.3
libpng 1.6.34 : zlib 1.2.11
$ ls /usr/share/tesseract-ocr/tessdata/
configs eng.traineddata ita.traineddata osd.traineddata pdf.ttf tessconfigs
$ echo $TESSDATA_PREFIX
/usr/share/tesseract-ocr/
我遇到了同样的问题,在我的例子中,目录
中有一个名为tsv
的文件
/usr/share/tesseract-ocr/tessdata/configs
不见了。我从以下网址下载了 tesseract 的源代码:
https://github.com/tesseract-ocr/tesseract/archive/3.05.00.tar.gz
并替换了文件夹 configs
的内容。