Viola Jones 阈值 Haar 特征误差值

Viola Jones threshold value Haar features error value

我已经阅读了 2004 年的 viola 论文。在 3.1 中,他们解释了阈值计算。但我非常困惑。 它读作

For each feature, the examples are sorted based on feature value

Question1) Is sorted list a list of haar feature values calculated from integral image of examples。因此,如果我们有一个特征和 10 张图像(正面和负面)。我们得到与每个输入图像相关的 10 个结果。

The AdaBoost optimal threshold for that feature can then be computed in a single pass over this sorted list. For each element in the sorted list, four sums are maintained and evaluated: the total sum of positive example weights T +, the total sum of negative example weights T −, the sum of positive weights below the current example S+ and the sum of negative weights below the current example S−

问题2)排序的目的是什么。我想最高的那个是最能描述图像的那个。但从算法上讲,它如何影响 (S- S+ T+ T-)。

问题 3) 现在对于一个排序列表,我们计算 (S- S+ T+ T-)。这是否意味着每个条目都有自己的 (S- S+ T- T+) 还是只有 一个 (S- S+ T- T+) 用于整个列表。

The error for a threshold which splits the range between the current and previous example in the sorted list is: e = min ( S+ + (T − − S−), S− + (T + − S+)) ,

问题 4) 这在某种程度上回答了我之前的问题,但我不确定。 所以为了我们有 "e " 每个输入图像。我们需要为列表中的每个条目维护 (S- S+ T- T+)。但是,在我们为该特征计算了 N 个(每个图像一个)之后,我们对 "e" 做了什么。

提前致谢,如果这让我感到困惑或者您需要对我的问题进行更多说明,请告诉我。

Question1) Is sorted list a list of haar feature values calculated from integral image of examples. So if we have a feature and 10 images(positive and negative). We get 10 results associated with each input image.

您获得 10 个特征结果,每个输入图像关联一个结果。每张图片都被标记为正面或负面。

Question 2) what is the purpose of sorting. I guess the one with the highest is the one describes the image best. But algorithmically how does it affect (S- S+ T+ T-).

最高的图像是对该特征响应最高的图像。您根据响应排序,而不是根据权重排序。

你对它们进行排序的原因是你试图计算的两个东西是 "the sum of positive weights below the current example S+ and the sum of negative weights below the current example S−"。如果列表已排序,那么您可以保留一个 运行 总和,并且在每个点,您已将其权重添加到总和的所有示例的特征响应都小于(即 "below")当前示例。如果列表未排序,那将不起作用。然后,您可以评估与使用该示例和下一个示例之间的中间响应级别作为阈值相关的错误。

Question3) Now for a sorted list we calculate (S- S+ T+ T-). Does this mean each entry holds its own (S- S+ T- T+) or is there only One (S- S+ T- T+) for the whole list.

每个示例将有一个 S- 和一个 S+,因为它是 "the sum of positive weights below the current example"。 T+ 和 T- 是为整个列表计算的,我不知道为什么他们说你需要为每个元素维护它。

Question4) This somewhat answers my previous question but I am not sure. So in order for us have "e "for each input image. We need to maintain (S- S+ T- T+) for each entry in the list. But what do we do with "e" after we calculate N of them (one for each image) for that feature.

您从所有这些中选择了最小值,这是放置阈值的最佳位置(这将是这两个示例响应的中点),因为它具有最小误差(误报 + 假底片)。顺便说一句,每个点有两个选择的原因(即 e = min ( S+ + (T − − S−), S− + (T + − S+)) )是你可以选择是否设置阈值,以便高于该响应水平的值被认为是正的(第一项),或低于它的值被认为是正的。

如果是前者,那么S+就是你的误报,(T- - S-)就是你的漏报。如果是后者,那么 S- 是你的假阴性, (T+ - S+) 是你的假阳性。