使用 opencv 从图像中进行字符检测和裁剪 python

character detection and crop from an image using opencv python

我有一个项目,我必须从图像中检测孟加拉语数字。我决定做一个实验,比如带 space 和不带 space 的数字。我的 python 程序可以用 space 的图像检测所有数字。

当我在没有 spaces 的情况下提供图像时出现问题。它不能像上一个那样顺利地切号。

这是我的代码

import cv2

image = cv2.imread("number.png")
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) 
_,thresh = cv2.threshold(gray,70,255,cv2.THRESH_BINARY_INV) 
kernel = cv2.getStructuringElement(cv2.MORPH_CROSS,(3,3))
dilated = cv2.dilate(thresh,kernel,iterations = 0) 
_,contours, hierarchy = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE) 

i=5
for contour in contours:

    [x,y,w,h] = cv2.boundingRect(contour)

    cv2.imwrite(str(i)+".jpg",image[y:y+h,x:x+h])
    i=i+1

起初我使用 dilated in 来查找轮廓,但它不适用于没有 space 图像的数字。然后我直接使用 thresh 输出,之后我得到了大部分数字,但我无法完美地切割它们,因为轮廓区域检测数字与其他数字的某些部分。虽然它在第二张图片中没有 space 但仍然有 2 个数字没有相互接触。那么为什么输出是这样的呢?

与Space:

没有Space:

不幸的是,我没有注意到在切割矩形部分时我添加了 x:x+h 而不是 x:x+w。这是主要问题。修改后程序运行良好。对不起。