unicharset_extractor: 找不到命令

unicharset_extractor: command not found

我想使用 tesseract 创建新的火车数据。所以请按照以下网站中提到的步骤进行操作。

https://blog.cedric.ws/how-to-train-tesseract-301

我在 OS X 终端中执行 Unicharset 时出现以下错误。

命令:

unicharset_extractor eng.micrtest.exp.box

错误: -bash: unicharset_extractor: 找不到命令

我使用过以下软件版本

OS: OSX EI 标题 10.11.1

超正方体 3.04.01 leptonica-1.72 libjpeg 8d:libpng 1.6.21:libtiff 4.0.6:lib 1.2.5

是否可以在 OSx 中执行 unchaste_extractor 命令?

提前致谢。

您将需要构建 Tesseract 训练可执行文件;它们与常规的 Tesseract 可执行文件分开。

https://github.com/tesseract-ocr/tesseract/wiki/Compiling

问题是 "Unicharset_extractor" 没有安装在您的系统中。所以请安装tesseract训练工具

安装培训工具

brew install --with-training-tools tesseract

如果您已经安装了 tesseract,请卸载它。

卸载 TESSERACT

brew uninstall tesseract

注意:请在安装训练工具时阅读日志,并按照日志中提到的步骤进行操作。

安装培训工具需要更多时间,因此您永远不会同时关闭终端。

请在执行上述命令之前安装 Homebrew。