如何改变opencv中轮廓形成的区域(阈值)
how to change area of contours formation in opencv (threshold)
我正在尝试构建 OCR 以从图像中提取文本,我正在使用轮廓来形成文本字符的边界,
经过多次尝试更改 cv2.threshold 我在形成文本字符边界时得到了最合适的轮廓。
#files = os.listdir(r'letters/harry.jpeg',0)
file = r'/home/naga/Documents/Naga/Machine Learning/Data_extract/letters/Harry/Harry Potter and the Sorcerer s Stone-page-006.jpg'
im1 = cv2.imread(file,0)
im = cv2.imread(file)
# ret,thresh1 = cv2.threshold(im1,180,278,cv2.THRESH_BINARY)
# _,contours, hierarchy = cv2.findContours(thresh1,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
ret,thresh1 = cv2.threshold(im1,180,278,cv2.THRESH_BINARY)
kernel = np.ones((5,5),np.uint8)
dilated = cv2.dilate(im1,kernel,iterations = 1)
_,contours, hierarchy = cv2.findContours(dilated,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
for cnt in contours:
x,y,w,h = cv2.boundingRect(cnt)
#bound the images
cv2.rectangle(im,(x,y),(x+w,y+h),(0,255,0),1)
cv2.namedWindow('BindingBox', cv2.WINDOW_NORMAL)
cv2.imwrite('output2/BindingBox4.jpg',im)
现在我想在文字上创建轮廓。我需要每个单词的父轮廓。 Open cv.
中要更改的属性是什么
我是 opencv 的新手,我跟进了 cv2 threshold 但无法理解如何应用它。请提供您在形成单词轮廓方面的输入。
一个简单的解决方案是在 运行 findcontour 函数之前扩大阈值图像的结果。
ret,thresh1 = cv2.threshold(im1,180,255,cv2.THRESH_BINARY_INV)
kernel = np.ones((5,5),np.uint8)
dilated = cv2.dilate(thresh1,kernel,iterations = 2)
contours, hierarchy = cv2.findContours(dilated,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
膨胀是一种形态学函数,可以增加二元斑点的面积。它会倾向于将所有附近的 blob 组合起来形成一个单一的 blob,这正是您将文本组合成单词所需要的。
如果不是所有文本都组合成一个单词,您可以增加迭代次数。如果您不确定此处使用的值,则需要反复试验。
阅读形态学过程以更好地理解该主题。它是用于基本图像处理的有用工具。
作为额外提示,请尝试在 openCV 中搜索函数 adaptivethreshold。将文本图像二值化会让您的生活更轻松。
我正在尝试构建 OCR 以从图像中提取文本,我正在使用轮廓来形成文本字符的边界,
经过多次尝试更改 cv2.threshold 我在形成文本字符边界时得到了最合适的轮廓。
#files = os.listdir(r'letters/harry.jpeg',0)
file = r'/home/naga/Documents/Naga/Machine Learning/Data_extract/letters/Harry/Harry Potter and the Sorcerer s Stone-page-006.jpg'
im1 = cv2.imread(file,0)
im = cv2.imread(file)
# ret,thresh1 = cv2.threshold(im1,180,278,cv2.THRESH_BINARY)
# _,contours, hierarchy = cv2.findContours(thresh1,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
ret,thresh1 = cv2.threshold(im1,180,278,cv2.THRESH_BINARY)
kernel = np.ones((5,5),np.uint8)
dilated = cv2.dilate(im1,kernel,iterations = 1)
_,contours, hierarchy = cv2.findContours(dilated,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
for cnt in contours:
x,y,w,h = cv2.boundingRect(cnt)
#bound the images
cv2.rectangle(im,(x,y),(x+w,y+h),(0,255,0),1)
cv2.namedWindow('BindingBox', cv2.WINDOW_NORMAL)
cv2.imwrite('output2/BindingBox4.jpg',im)
现在我想在文字上创建轮廓。我需要每个单词的父轮廓。 Open cv.
中要更改的属性是什么我是 opencv 的新手,我跟进了 cv2 threshold 但无法理解如何应用它。请提供您在形成单词轮廓方面的输入。
一个简单的解决方案是在 运行 findcontour 函数之前扩大阈值图像的结果。
ret,thresh1 = cv2.threshold(im1,180,255,cv2.THRESH_BINARY_INV)
kernel = np.ones((5,5),np.uint8)
dilated = cv2.dilate(thresh1,kernel,iterations = 2)
contours, hierarchy = cv2.findContours(dilated,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
膨胀是一种形态学函数,可以增加二元斑点的面积。它会倾向于将所有附近的 blob 组合起来形成一个单一的 blob,这正是您将文本组合成单词所需要的。
如果不是所有文本都组合成一个单词,您可以增加迭代次数。如果您不确定此处使用的值,则需要反复试验。
阅读形态学过程以更好地理解该主题。它是用于基本图像处理的有用工具。
作为额外提示,请尝试在 openCV 中搜索函数 adaptivethreshold。将文本图像二值化会让您的生活更轻松。