如何找到检测算法在视频中发生的检测次数 windows?

How to find number of detection windows occured in a video for a detection algorithm?

我正在使用默认的 HOG 检测器 (hog.detectMultiScale) 来检测视频中的人物。我想知道整个视频一共出现了多少检测windows,因为我想计算检测率和漏检率

我试过这个 link 但我不相信他们建议的解决方案。他们为图像的情况提供了解释。它是否也适用于视频?

或者是无法求出每帧的检测数?

HOG 检测器从视频中获取帧,因此您可以将视频视为一系列独立图像,并根据这些结果计算精度和召回率。

您可以通过查看 hog.detectMultiScale.

的输出 Rect 数组的长度来找到给定帧中检测到的人数

要找到整个视频的检测总数,您只需将每个帧的检测结果数组的长度相加即可。

召回率是正确检测到的正例的百分比。这与命中率非常相似。

然而,只看召回率或命中率可能会产生极大的误导。例如,您可以将图像中的每个 space 都分类为一个人,这样您的召回率和命中率就会达到 100%。但是,这违背了试图检测某些东西的全部目的。这就是为什么大多数人也关注精度。精度是正确标记的检测的百分比。

并非所有的检测都包含一个人。仅查看检测到的框数和图像中的人数并不能准确衡量命中率、召回率或精确率。