Haar-like 特征来检测物体
Haar-like features to detect objects
我正在研究 Viola-Jones 论文,以便更好地理解他们的对象检测算法并生成适用的程序。在特征主题的最后一段中,作者谈到了检测器的基本分辨率,即 24x24,他们说详尽的矩形特征集非常大,超过 180,000 。请注意,与 Haar 基础不同,矩形特征集是超完备的。这是否意味着每个矩形特征都是 24 x 24,或者它只是意味着我们将给定图像分成 24 * 24 块? 180000是每24*24块找几类Haar-like特征的结果?而且我也无法理解最后一部分指出矩形特征集过于完整。当我们谈论矩形特征时,过度完备意味着什么?谢谢。
每个 24X24 矩形特征只为您提供一个数字,如前文在同一段落中所述 "The value of a two-rectangle feature is the difference between the sum of the pixels within two rectangular regions" 和 "A three-rectangle feature computes the sum within two outside rectangles subtracted from the sum in a center rectangle. Finally a four-rectangle feature computes the difference between diagonal pairs of rectangles."
有关数字 180,00 的解释,您可以在以下位置找到:
Viola-Jones' face detection claims 180k features
超完备集意味着您有一些特征是其他特征的线性组合。在 24X24 矩形特征的情况下,我们可以为此 space 构建一个线性基,方法是在其中一个正方形中取值为 1 的所有矩形,在所有其他正方形中取值为 0。如果我们计算这个配置有多少个选项,我们得到 24*24=576,这比 180,000 少得多。这意味着从他们的 180,000 个集合中,我们有一些矩形可以作为我们集合中其他矩形的组合得到。
我正在研究 Viola-Jones 论文,以便更好地理解他们的对象检测算法并生成适用的程序。在特征主题的最后一段中,作者谈到了检测器的基本分辨率,即 24x24,他们说详尽的矩形特征集非常大,超过 180,000 。请注意,与 Haar 基础不同,矩形特征集是超完备的。这是否意味着每个矩形特征都是 24 x 24,或者它只是意味着我们将给定图像分成 24 * 24 块? 180000是每24*24块找几类Haar-like特征的结果?而且我也无法理解最后一部分指出矩形特征集过于完整。当我们谈论矩形特征时,过度完备意味着什么?谢谢。
每个 24X24 矩形特征只为您提供一个数字,如前文在同一段落中所述 "The value of a two-rectangle feature is the difference between the sum of the pixels within two rectangular regions" 和 "A three-rectangle feature computes the sum within two outside rectangles subtracted from the sum in a center rectangle. Finally a four-rectangle feature computes the difference between diagonal pairs of rectangles."
有关数字 180,00 的解释,您可以在以下位置找到: Viola-Jones' face detection claims 180k features
超完备集意味着您有一些特征是其他特征的线性组合。在 24X24 矩形特征的情况下,我们可以为此 space 构建一个线性基,方法是在其中一个正方形中取值为 1 的所有矩形,在所有其他正方形中取值为 0。如果我们计算这个配置有多少个选项,我们得到 24*24=576,这比 180,000 少得多。这意味着从他们的 180,000 个集合中,我们有一些矩形可以作为我们集合中其他矩形的组合得到。