如何使用 python OpenCV 查找单通道图像中匹配特定值的最大连通分量?
How to use python OpenCV to find largest connected component in a single channel image that matches a specific value?
所以我有一个单通道图像,主要是 0s(背景),前景像素的一些值,如 20、21、22。非零前景像素大部分与具有相同值的其他前景像素聚集在一起。但是,图像中存在一些噪点。为了消除噪声,我想使用连通分量分析,并且对于每个值(在本例中为 20、21、22),将除最大连通分量以外的所有值都归零。所以最后,我将有 3 个大的连接组件并且没有噪音。我将如何使用 cv2.connectedComponentsWithStats 来完成这个?它的文档似乎很少,甚至在查看 this post 之后,我也不完全理解如何解析函数的 return 值。有没有一种方法可以指定我只需要与特定灰度值匹配的连接组件?
这是一般方法:
- 创建一个新的空白图像以将组件添加到
- 遍历图像中每个不同的非零值
- 为每个值创建一个掩码(为每个值提供多个 blob)
- 运行
connectedComponentsWithStats()
戴口罩
- 找到最大面积对应的非零标签
- 创建一个具有最大标签的蒙版,并将值插入到蒙版位置的新图像中
这里令人讨厌的是第 5 步,因为 0 的值通常但不总是最大的组件。所以我们需要按面积得到最大的非零分量
这是一些我认为可以实现所有功能的代码(一些示例图像肯定会很好):
import cv2
import numpy as np
img = np.array([
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2]], dtype=np.uint8)
new_img = np.zeros_like(img) # step 1
for val in np.unique(img)[1:]: # step 2
mask = np.uint8(img == val) # step 3
labels, stats = cv2.connectedComponentsWithStats(mask, 4)[1:3] # step 4
largest_label = 1 + np.argmax(stats[1:, cv2.CC_STAT_AREA]) # step 5
new_img[labels == largest_label] = val # step 6
print(new_img)
显示所需的输出:
[[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]]
为了完成代码,首先我们创建新的标记图像,毫无想象力地称为 new_img
,其中填充了零,稍后将由正确的标签填充。然后,np.unique()
找到图像中的唯一值,除了第一个值外,我正在获取所有值;请注意,np.unique()
returns 是一个排序数组,因此 0 将是第一个值,我们不需要找到零的分量。对于每个唯一的 val,创建一个填充有 0 和 1 的掩码,并在此掩码上连接 运行 个组件。这将使用不同的标签标记每个不同的区域。然后我们可以抓取最大的非零标记组件**,为它创建一个掩码,并将该 val 添加到新图像的那个地方。
** 这是代码中看起来很奇怪的烦人之处。
largest_label = 1 + np.argmax(stats[1:, cv2.CC_STAT_AREA])
首先,您可以查看您链接的关于 stats
数组形状的答案,但每一行都对应一个标签(因此标签 0 将对应第一行,依此类推),并且该列由整数 cv2.CC_STAT_AREA(即 4)定义。我们需要确保我们正在查看最大的非零标签,所以我只查看第一行之后的行。然后,抓取最大区域对应的索引。由于我们剃掉了零行,索引现在对应于 label-1
,因此加 1 以获得正确的标签。然后我们可以像往常一样屏蔽并插入值。
所以我有一个单通道图像,主要是 0s(背景),前景像素的一些值,如 20、21、22。非零前景像素大部分与具有相同值的其他前景像素聚集在一起。但是,图像中存在一些噪点。为了消除噪声,我想使用连通分量分析,并且对于每个值(在本例中为 20、21、22),将除最大连通分量以外的所有值都归零。所以最后,我将有 3 个大的连接组件并且没有噪音。我将如何使用 cv2.connectedComponentsWithStats 来完成这个?它的文档似乎很少,甚至在查看 this post 之后,我也不完全理解如何解析函数的 return 值。有没有一种方法可以指定我只需要与特定灰度值匹配的连接组件?
这是一般方法:
- 创建一个新的空白图像以将组件添加到
- 遍历图像中每个不同的非零值
- 为每个值创建一个掩码(为每个值提供多个 blob)
- 运行
connectedComponentsWithStats()
戴口罩 - 找到最大面积对应的非零标签
- 创建一个具有最大标签的蒙版,并将值插入到蒙版位置的新图像中
这里令人讨厌的是第 5 步,因为 0 的值通常但不总是最大的组件。所以我们需要按面积得到最大的非零分量
这是一些我认为可以实现所有功能的代码(一些示例图像肯定会很好):
import cv2
import numpy as np
img = np.array([
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2],
[1, 0, 1, 1, 2]], dtype=np.uint8)
new_img = np.zeros_like(img) # step 1
for val in np.unique(img)[1:]: # step 2
mask = np.uint8(img == val) # step 3
labels, stats = cv2.connectedComponentsWithStats(mask, 4)[1:3] # step 4
largest_label = 1 + np.argmax(stats[1:, cv2.CC_STAT_AREA]) # step 5
new_img[labels == largest_label] = val # step 6
print(new_img)
显示所需的输出:
[[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]
[0 0 1 1 2]]
为了完成代码,首先我们创建新的标记图像,毫无想象力地称为 new_img
,其中填充了零,稍后将由正确的标签填充。然后,np.unique()
找到图像中的唯一值,除了第一个值外,我正在获取所有值;请注意,np.unique()
returns 是一个排序数组,因此 0 将是第一个值,我们不需要找到零的分量。对于每个唯一的 val,创建一个填充有 0 和 1 的掩码,并在此掩码上连接 运行 个组件。这将使用不同的标签标记每个不同的区域。然后我们可以抓取最大的非零标记组件**,为它创建一个掩码,并将该 val 添加到新图像的那个地方。
** 这是代码中看起来很奇怪的烦人之处。
largest_label = 1 + np.argmax(stats[1:, cv2.CC_STAT_AREA])
首先,您可以查看您链接的关于 stats
数组形状的答案,但每一行都对应一个标签(因此标签 0 将对应第一行,依此类推),并且该列由整数 cv2.CC_STAT_AREA(即 4)定义。我们需要确保我们正在查看最大的非零标签,所以我只查看第一行之后的行。然后,抓取最大区域对应的索引。由于我们剃掉了零行,索引现在对应于 label-1
,因此加 1 以获得正确的标签。然后我们可以像往常一样屏蔽并插入值。