Tesseract .tr 文件为空

Tesseract .tr file empty

我正在尝试使用 TesseractOCR 将文本识别集成到我的应用程序中。我需要它来学习自定义字体。我通过 Homebrew 在我的 Mac 上安装了 Tesseract。我有一个 tiff 文件:eng.scout-cond.exp0.tiff,我正在将其转换为“.box”文件。当我 运行 命令 tesseract eng.scout-cond.exp0.tiff eng.scout-cond.box nobatch box.train.stderr 它说 Tesseract Open Source OCR Engine v4.1.1 with Leptonica 然后生成一个名为eng.scout-cond.box.tr

的文件
  1. 我不明白为什么它是 .tr 扩展名而不是教程中向我展示的 .box 扩展名。

  2. 在文本编辑器中打开 .tr 文件时,它是空的。

什么会导致它为空?

eng.scout-cond.exp0.tiff

The tutorial I'm following

我漏掉了一步,原来post中显示的命令是从.box文件和.tiff文件创建一个.tr文件。

解决方案: 我使用了命令 tesseract eng.scout-cond.exp0.png eng.scout-cond.exp0 batch.nochop makebox 制作 .box 文件。然后我运行原来的命令post.