Tesseract 使用的过滤器类型

Types of filters used by Tesseract

我正在测试通过在图像预处理中使用的不同过滤器,我可以在多大程度上提高 Tesseract OCR 识别的结果。但要相应地这样做,我需要知道 Tesseract 本身使用什么类型的过滤。通过查看结果,很可能只有一种过滤类型是转换为灰度,然后应用二进制阈值。

有谁知道使用了哪些类型的过滤器或者我在哪里可以找到此类信息?

如果我没记错的话,Tesseract v3 使用 Otsu thresholding

您可以使用getThresholdedImage()方法查看结果。

如您所见,上面@Piglet 发布的 link 可能会有帮助:https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality