如何使 pytesseract 正确读取 slahed 0

Question

我正在尝试读取图像上的 phone 数字。由于图像非常清晰，我没有应用任何预处理，但 pytesseract 有时无法正确识别 0。我试图训练类似的字体，但它给出了相同的结果。一个例子是 this image

我的代码非常简单：

image=Image.open('Fotolar/0.png')
custom_config = r'--oem 3 --psm 6'
pytesseract.image_to_string(image,config=custom_config)

我得到这个结果：'9543 684 9993'

我尝试对我的图像进行微调，但我做不到，因为所有教程都是基于 ubuntu 而我不熟悉的。你有什么建议吗？

Answer 1

教程很清楚。如果你想像我一样 fine-tune，在教程的和中，不要输入“make training”，而是添加一些变量，如“START_MODEL”。

如果您的问题与我的相同https://github.com/yusufuyanik1/SlashedZeroOCR，您也可以使用我的slashedzero.traineddata。

How can I make pytesseract read slahed 0 correctly