Tesseract 4 在与 OCR 引擎模式一起使用时无法加载任何语言 - "Legacy + LSTM engines" (--oem 2)
Tesseract 4 couldn't load any languages when used with OCR Engine mode - "Legacy + LSTM engines" (--oem 2)
我认为这个问题只与支持 LSTM 的 Tesseract 4 有关。由于我使用的是64位Windows系统,所以我下载了64-bit windows executable from here - https://github.com/UB-Mannheim/tesseract/wiki
它具有以下 OCR 引擎模式:
- 0 仅限旧版引擎。
- 1 仅限神经网络 LSTM 引擎。
- 2 个旧版 + LSTM 引擎。
- 3 默认,基于可用的。
它适用于除 2 之外的所有模式。
当 运行 与 --oem 1
tesseract --oem 1 1.jpg 1
结果:
Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 561
Detected 5 diacritics
并用相应的 OCR 结果创建一个文件 1.txt。
当 运行 与 --oem 2
tesseract --oem 2 1.jpg 1
结果:
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
并且没有生成输出。
我以为错误会与语言安装有关,但
tesseract --list-langs
这给了我以下结果
List of available languages (2):
eng
osd
我什至手动检查了 tessdata 文件夹,这里是相同的截图
这清楚地表明我已经拥有 eng 语言。
Can anyone help me with the exact problem that is disallowing me use
Legacy + LSTM engines (--oem 2) mode.
是的,您有 eng 语言,但仅支持 LSTM。如果您想获得 LSTM 和 Legacy 支持,您需要从 tessdata repository
下载数据
我认为这个问题只与支持 LSTM 的 Tesseract 4 有关。由于我使用的是64位Windows系统,所以我下载了64-bit windows executable from here - https://github.com/UB-Mannheim/tesseract/wiki
它具有以下 OCR 引擎模式:
- 0 仅限旧版引擎。
- 1 仅限神经网络 LSTM 引擎。
- 2 个旧版 + LSTM 引擎。
- 3 默认,基于可用的。
它适用于除 2 之外的所有模式。
当 运行 与 --oem 1
tesseract --oem 1 1.jpg 1
结果:
Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 561
Detected 5 diacritics
并用相应的 OCR 结果创建一个文件 1.txt。
当 运行 与 --oem 2
tesseract --oem 2 1.jpg 1
结果:
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
并且没有生成输出。
我以为错误会与语言安装有关,但
tesseract --list-langs
这给了我以下结果
List of available languages (2):
eng
osd
我什至手动检查了 tessdata 文件夹,这里是相同的截图
这清楚地表明我已经拥有 eng 语言。
Can anyone help me with the exact problem that is disallowing me use Legacy + LSTM engines (--oem 2) mode.
是的,您有 eng 语言,但仅支持 LSTM。如果您想获得 LSTM 和 Legacy 支持,您需要从 tessdata repository
下载数据