Python 的光学字符识别 - 自动裁剪

Optical Character Recognition with Python - Auto Cropping

我正在处理各种 OCR 任务,使用 Python 进行预处理并使用 Tesseract 进行分析。

最新的问题是如何裁剪带有例如内部图像的图像。 6 张名片的扫描图像或具有两个不同部分的板的照片。我想把一张图片(.jpg,.png)上的名片变成6张图片。

理想情况下,我想在 Python(R 也是如此)中执行此操作,但我愿意接受所有建议。谢谢

通过使用 opencv,您可能能够找到它们的轮廓,就像它们在 their documentation about finding contours or here.

中所做的那样

我也写了一个网格检测器,如果你的卡片大小都一样,可能是个灵感来源,如果不是,也可能是个灵感来源... https://github.com/julienpalard/grid-finder