Tesseract OCR - 指定模式
Tesseract OCR - specify pattern
我正在尝试使用 Tesseract(版本 3.04.00)执行 OCR。
我所有的图像都具有相同的模式(数字点数字,即精度为 2 位的小数)。我尝试使用 --user-patterns
选项,但无法正常工作。
我做了什么:
- 创建文件
patterns.txt
,第一行 \d.\d\d
- 使用选项
--user-patterns patterns.txt
但是我得到以下错误:
pytesseract.pytesseract.TesseractError: (1, "Tesseract Open Source OCR Engine v3.04.00 with Leptonica read_params_file: Can't open 1 read_params_file: Can't open user-patterns read_params_file: parameter not found: \d.\d\d")
如何将我的模式指定为 Tesseract?这甚至是正确的方法吗?
在此先感谢您的帮助或建议,我没有找到太多关于 Tesseract 的文档。
编辑:添加Python代码
img = cv2.imread("path/to/image", cv2.IMREAD_GRAYSCALE)
text = pytesseract.image_to_string(img, config="-psm 7 --user-patterns patterns.txt")
print(text)
没关系,我认为 Tesseract 对于我的用例来说太过分了。
我拍摄了从 0 到 9 的每个数字的图像,并选择了我想要预测的图像的最小均方误差。在我的测试数据集上获得 100% 的准确率。
我正在尝试使用 Tesseract(版本 3.04.00)执行 OCR。
我所有的图像都具有相同的模式(数字点数字,即精度为 2 位的小数)。我尝试使用 --user-patterns
选项,但无法正常工作。
我做了什么:
- 创建文件
patterns.txt
,第一行\d.\d\d
- 使用选项
--user-patterns patterns.txt
但是我得到以下错误:
pytesseract.pytesseract.TesseractError: (1, "Tesseract Open Source OCR Engine v3.04.00 with Leptonica read_params_file: Can't open 1 read_params_file: Can't open user-patterns read_params_file: parameter not found: \d.\d\d")
如何将我的模式指定为 Tesseract?这甚至是正确的方法吗? 在此先感谢您的帮助或建议,我没有找到太多关于 Tesseract 的文档。
编辑:添加Python代码
img = cv2.imread("path/to/image", cv2.IMREAD_GRAYSCALE)
text = pytesseract.image_to_string(img, config="-psm 7 --user-patterns patterns.txt")
print(text)
没关系,我认为 Tesseract 对于我的用例来说太过分了。
我拍摄了从 0 到 9 的每个数字的图像,并选择了我想要预测的图像的最小均方误差。在我的测试数据集上获得 100% 的准确率。