Tesseract OCR - 指定模式

Question

我正在尝试使用 Tesseract（版本 3.04.00）执行 OCR。我所有的图像都具有相同的模式（数字点数字，即精度为 2 位的小数）。我尝试使用 --user-patterns 选项，但无法正常工作。

我做了什么：

创建文件 patterns.txt，第一行 \d.\d\d
使用选项 --user-patterns patterns.txt

但是我得到以下错误：

pytesseract.pytesseract.TesseractError: (1, "Tesseract Open Source OCR Engine v3.04.00 with Leptonica read_params_file: Can't open 1 read_params_file: Can't open user-patterns read_params_file: parameter not found: \d.\d\d")

如何将我的模式指定为 Tesseract？这甚至是正确的方法吗？在此先感谢您的帮助或建议，我没有找到太多关于 Tesseract 的文档。

编辑：添加Python代码

img = cv2.imread("path/to/image", cv2.IMREAD_GRAYSCALE)
text = pytesseract.image_to_string(img, config="-psm 7 --user-patterns patterns.txt")
print(text)

Answer 1

没关系，我认为 Tesseract 对于我的用例来说太过分了。

我拍摄了从 0 到 9 的每个数字的图像，并选择了我想要预测的图像的最小均方误差。在我的测试数据集上获得 100% 的准确率。

Tesseract OCR - 指定模式

Tesseract OCR - specify pattern

python

ocr

tesseract

python-tesseract