如何使 pytesseract 正确读取 slahed 0

How can I make pytesseract read slahed 0 correctly

我正在尝试读取图像上的 phone 数字。由于图像非常清晰,我没有应用任何预处理,但 pytesseract 有时无法正确识别 0。我试图训练类似的字体,但它给出了相同的结果。一个例子是 this image

我的代码非常简单:

image=Image.open('Fotolar/0.png')
custom_config = r'--oem 3 --psm 6'
pytesseract.image_to_string(image,config=custom_config)

我得到这个结果:'9543 684 9993'

我尝试对我的图像进行微调,但我做不到,因为所有教程都是基于 ubuntu 而我不熟悉的。你有什么建议吗?

我遵循了本教程 https://www.youtube.com/watch?v=JPDeiGc2an8&t=444s and used files and instruction on this repo https://github.com/kevinbicycle/ocrd-train

教程很清楚。如果你想像我一样 fine-tune,在教程的 和 中,不要输入“make training”,而是添加一些变量,如“START_MODEL”。

如果您的问题与我的相同https://github.com/yusufuyanik1/SlashedZeroOCR,您也可以使用我的slashedzero.traineddata。