PaddleOCR 性能与 Tesseract 相比如何?
How does PaddleOCR performance compare to Tesseract?
我最近遇到了 PaddleOCR,我想知道这个 OCR 系统与 Tesseract 相比如何。是否有可用的数据或基准?
我找到了 PaddleOCR 2 and Tesseract 4 之间的比较,但仅限于英文文本。简要总结:
- PaddleOCR 在 CPU 上比 Tesseract 稍慢,但在 GPU 支持下,它在标准 GPU 上比 Tesseract 快 46%。
- 如果没有post处理,PaddleOCR主要会出现单词和标点符号之间缺少空格的错误。但是,这些错误很容易纠正。 post处理后,精度与 Tesseract 相当(少 1%)。
- 英语的预训练模型只有 Tesseracts 英语训练数据文件大小的 10%(2MB 对 23MB)。
对于目前似乎是 PaddleOCR 主要优先级的中文文本,情况可能有所不同。
我用它们测试了英语和日语,但有趣的是,PaddleOCR 似乎比 Tesseract 更能识别它们。
PaddleOCR 的文本检测似乎也更好。
然而,根据他们的帖子,PaddleOCR 不能很好地处理空格,并且有非中国(或日本)用户的投诉。
PaddleOCR 非常渴望结合作为研究论文发表的最新 recognition/detection 算法,为此我决定使用 PaddleOCR。
我在一些研究中都使用了将近一年。可以说各有所长
PaddleOCR 专家:
- 如果文本旋转非90度旋转,PaddleOCR仍然可以正确检测到一些文本,但Tesseract即使使用OSD也无法做到这一点。
- 您可以使用 检测 结果来修复旋转,但 Tesseract 可能会检索 non-sense 结果。
- 如果您无法对图像进行二值化处理,当图像位于 RGB/BGR 时,PaddleOCR 比 Tesseract 效果更好。
Tesseract PRO:
- PaddleOCR 在检测 空格 时存在严重问题,即使在操纵参数后也是如此,但他们正在努力在下一次升级中修复此问题。 Tesseract 没有明显的空间问题。
- Tesseract 在处理扫描文件方面更好。
- 图像 分割模式 可以帮助改善结果。
- 带有 长 文本的 二值化 图像的 Tesseract 结果通常优于 PaddleOCR。
- Tesseract 在检测 符号 方面要好得多。
- Tesseract 在 CPU 上更快。
简而言之,使用 Tesseract 非常适合扫描文档,使用 PaddleOCR 非常适合一般计算机视觉项目。
我最近遇到了 PaddleOCR,我想知道这个 OCR 系统与 Tesseract 相比如何。是否有可用的数据或基准?
我找到了 PaddleOCR 2 and Tesseract 4 之间的比较,但仅限于英文文本。简要总结:
- PaddleOCR 在 CPU 上比 Tesseract 稍慢,但在 GPU 支持下,它在标准 GPU 上比 Tesseract 快 46%。
- 如果没有post处理,PaddleOCR主要会出现单词和标点符号之间缺少空格的错误。但是,这些错误很容易纠正。 post处理后,精度与 Tesseract 相当(少 1%)。
- 英语的预训练模型只有 Tesseracts 英语训练数据文件大小的 10%(2MB 对 23MB)。
对于目前似乎是 PaddleOCR 主要优先级的中文文本,情况可能有所不同。
我用它们测试了英语和日语,但有趣的是,PaddleOCR 似乎比 Tesseract 更能识别它们。 PaddleOCR 的文本检测似乎也更好。 然而,根据他们的帖子,PaddleOCR 不能很好地处理空格,并且有非中国(或日本)用户的投诉。 PaddleOCR 非常渴望结合作为研究论文发表的最新 recognition/detection 算法,为此我决定使用 PaddleOCR。
我在一些研究中都使用了将近一年。可以说各有所长
PaddleOCR 专家:
- 如果文本旋转非90度旋转,PaddleOCR仍然可以正确检测到一些文本,但Tesseract即使使用OSD也无法做到这一点。
- 您可以使用 检测 结果来修复旋转,但 Tesseract 可能会检索 non-sense 结果。
- 如果您无法对图像进行二值化处理,当图像位于 RGB/BGR 时,PaddleOCR 比 Tesseract 效果更好。
Tesseract PRO:
- PaddleOCR 在检测 空格 时存在严重问题,即使在操纵参数后也是如此,但他们正在努力在下一次升级中修复此问题。 Tesseract 没有明显的空间问题。
- Tesseract 在处理扫描文件方面更好。
- 图像 分割模式 可以帮助改善结果。
- 带有 长 文本的 二值化 图像的 Tesseract 结果通常优于 PaddleOCR。
- Tesseract 在检测 符号 方面要好得多。
- Tesseract 在 CPU 上更快。
简而言之,使用 Tesseract 非常适合扫描文档,使用 PaddleOCR 非常适合一般计算机视觉项目。