如何在 opencv 的 bitwise_operation 中应用掩码?

How masking is applied in bitwise_operation in opencv?

我正在查看 OpenCV 的文档,发现了一些我无法理解的内容。我试图在网上找到它,但找不到任何令人满意的东西。你能帮我写一行代码吗? 这是代码:

# Load two images
img1 = cv.imread('messi5.jpg')
img2 = cv.imread('opencv-logo-white.png')
# I want to put logo on top-left corner, So I create a ROI
rows,cols,channels = img2.shape
roi = img1[0:rows, 0:cols ]
# Now create a mask of logo and create its inverse mask also
img2gray = cv.cvtColor(img2,cv.COLOR_BGR2GRAY)
ret, mask = cv.threshold(img2gray, 10, 255, cv.THRESH_BINARY)
mask_inv = cv.bitwise_not(mask)
# Now black-out the area of logo in ROI
img1_bg = cv.bitwise_and(roi,roi,mask = mask_inv)
# Take only region of logo from logo image.
img2_fg = cv.bitwise_and(img2,img2,mask = mask)
# Put logo in ROI and modify the main image
dst = cv.add(img1_bg,img2_fg)
img1[0:rows, 0:cols ] = dst
cv.imshow('res',img1)
cv.waitKey(0)
cv.destroyAllWindows()

我其实没看懂的是这两行

img1_bg = cv.bitwise_and(roi,roi,mask = mask_inv)

img2_fg = cv.bitwise_and(img2,img2,mask = mask)

这些行实际上做了什么以及如何应用掩码?

如果有人能解释在 bitwise_and 操作中应用的掩码,那将是 helpful.Thanks

如果您查看 tutorial

掩码是 OpenCV 徽标的黑白图像,它是通过对 OpenCV 徽标应用阈值创建的。

bitwise_and操作是logical and operation

在这种情况下,它采用两个 8 位数字表示一个像素并对这些数字应用与操作。

Documentation 描述了这个函数的作用。

由于前两个参数相同(roiimg2),如果不使用遮罩,结果将是相同的图像。蒙版为黑色的地方与目标图像保持一致。

在这种情况下,没有提供目标图像,因此 OpenCV 为函数中使用的目标图像分配黑色图像(零)(这通常是 OpenCV 在函数未提供 Matrix 时的工作方式)。

具体来说 img1_bg = cv.bitwise_and(roi,roi,mask = mask_inv) 将创建一个在函数中使用的黑色矩阵,稍后将成为输出 img1_bg。只有与 mask_inv 中的白色像素匹配的黑色图像部分被 roi 中的像素填充。这意味着在 mask_inv 中有白色像素。 roi值会被复制到对应坐标下函数生成的纯黑图像中。

同样地,img2_fg = cv.bitwise_and(img2,img2,mask = mask) 将创建一个在函数中使用的黑色矩阵,稍后将成为输出 img2_fg。此黑色图像中只有与 mask 中的白色像素匹配的部分才会填充 img2.

中的像素

这使得当您添加 img1_bgimg2_fg 时,结果只是每个图像中被屏蔽的部分。

就我个人而言,我认为这是对 bitwise_and 的混淆使用。我认为为了演示 bitwise_and 的功能,删除掩码参数会更清楚,如下所示:img1_bg = cv.bitwise_and(roi, mask_inv)。这将给出相同的结果,蒙版为黑色时为零,而 ROI 值则为黑色,因为蒙版具有全为 1 或全为零的像素。

如果您不想演示 bitwise_and 用法,在 python 我认为使用如下逻辑索引会更清楚:

output = np.zeros(img1.shape, np.uint8)
output[mask_inv] = img1_bg[mask_inv]
output[mask] = img2_fg[mask]