PaddleOCR 性能与 Tesseract 相比如何？

How does PaddleOCR performance compare to Tesseract?

paddle-paddle

我最近遇到了 PaddleOCR，我想知道这个 OCR 系统与 Tesseract 相比如何。是否有可用的数据或基准？

我找到了 PaddleOCR 2 and Tesseract 4 之间的比较，但仅限于英文文本。简要总结：

PaddleOCR 在 CPU 上比 Tesseract 稍慢，但在 GPU 支持下，它在标准 GPU 上比 Tesseract 快 46%。
如果没有post处理，PaddleOCR主要会出现单词和标点符号之间缺少空格的错误。但是，这些错误很容易纠正。 post处理后，精度与 Tesseract 相当（少 1%）。
英语的预训练模型只有 Tesseracts 英语训练数据文件大小的 10%（2MB 对 23MB）。

对于目前似乎是 PaddleOCR 主要优先级的中文文本，情况可能有所不同。

我用它们测试了英语和日语，但有趣的是，PaddleOCR 似乎比 Tesseract 更能识别它们。 PaddleOCR 的文本检测似乎也更好。然而，根据他们的帖子，PaddleOCR 不能很好地处理空格，并且有非中国（或日本）用户的投诉。 PaddleOCR 非常渴望结合作为研究论文发表的最新 recognition/detection 算法，为此我决定使用 PaddleOCR。

我在一些研究中都使用了将近一年。可以说各有所长

PaddleOCR 专家：

如果文本旋转非90度旋转，PaddleOCR仍然可以正确检测到一些文本，但Tesseract即使使用OSD也无法做到这一点。
您可以使用检测结果来修复旋转，但 Tesseract 可能会检索 non-sense 结果。
如果您无法对图像进行二值化处理，当图像位于 RGB/BGR 时，PaddleOCR 比 Tesseract 效果更好。

Tesseract PRO：

PaddleOCR 在检测空格时存在严重问题，即使在操纵参数后也是如此，但他们正在努力在下一次升级中修复此问题。 Tesseract 没有明显的空间问题。
Tesseract 在处理扫描文件方面更好。
图像 分割模式 可以帮助改善结果。
带有长文本的 二值化 图像的 Tesseract 结果通常优于 PaddleOCR。
Tesseract 在检测符号方面要好得多。
Tesseract 在 CPU 上更快。

简而言之，使用 Tesseract 非常适合扫描文档，使用 PaddleOCR 非常适合一般计算机视觉项目。

PaddleOCR 性能与 Tesseract 相比如何？

How does PaddleOCR performance compare to Tesseract?

paddle-paddle