Tesseract 4.5 return 相同图像结构的多个结果

Tesseract 4.5 return multiple results for same image structure

大家好,我对 tess4j 和 Arabic.trainddata 有疑问 问题是当我得到两次结果时结果不同 像这样 第一个输出:

"| 像我一样?: 139\n" +

"18/02/2020 : ?التاريخ\n" +

"叙利亚 H.O : ?الفرع?\n" +

第二个输出:

"б₩

"阿拉伯语:08/07/2020\n" +

"阿拉伯语:?叙利亚 H.O?\n" +

最后一个 raw 是反向的,它可能是另一个输出中的其他 raw

我需要使 ocr 始终从 RTL 开始读取或始终给我相同结果的解决方案

感谢大家:)

Tesseract 在连续运行中学习或调整其结果。您需要清除其自适应分类器或缓存(通过 ClearAdaptiveClassifierClearPersistentCache​Clear 方法)才能在后续运行中获得相同的结果。