Python 的光学字符识别 - 自动裁剪

Optical Character Recognition with Python - Auto Cropping

我正在处理各种 OCR 任务，使用 Python 进行预处理并使用 Tesseract 进行分析。

最新的问题是如何裁剪带有例如内部图像的图像。 6 张名片的扫描图像或具有两个不同部分的板的照片。我想把一张图片（.jpg，.png）上的名片变成6张图片。

理想情况下，我想在 Python（R 也是如此）中执行此操作，但我愿意接受所有建议。谢谢

通过使用 opencv，您可能能够找到它们的轮廓，就像它们在 their documentation about finding contours or here.

中所做的那样

我也写了一个网格检测器，如果你的卡片大小都一样，可能是个灵感来源，如果不是，也可能是个灵感来源... https://github.com/julienpalard/grid-finder