HOG Person Detector:为什么背景地面物体被检测为人?

HOG Person Detector: Why background ground objects are detected as people?

我正在从事一个涉及检测各种框架中的人的项目。检测器能够检测到帧序列中的大部分人。

但它有时会将静止的背景物体检测为人。我真的很想知道为什么会这样,以及检测器当前的工作如何导致这些误报。

如何消除这些误报?

误报检测示例:

正如this论文的作者在标题中暗示的那样:"How Far are We from Solving Pedestrian Detection?",我们还没有解决实际场景中视觉行人检测的问题,事实上,有人认为它会永远无法完全解决。

在城市场景中检测人物可能是计算机视觉中最困难的任务之一。场景中充斥着混乱、随机和不可预测的元素,行人可能被遮挡,他们可能隐藏在阴影中或摄像机无法看到的黑暗环境中。事实上,视觉行人检测仍然是迄今为止最重要的挑战之一。

而且您甚至没有使用最先进的方法,正如您在下图中看到的那样,自从 HOG 成为该任务的最佳算法以来已经有很长一段时间了。

(图片来自 Piotr Dollar、Christian Wojek、Bernt Schiele 和 Pietro Perona 的 "Pedestrian Detection: An Evaluation of the State of the Art"

那篇论文已经有点过时了,但你会看到即使是性能最好的算法在图像数据集中仍然表现不佳,更不用说真实场景了。

那么,为了回答您的问题,您可以做些什么来提高它的性能?这取决于。如果您可以在您的特定场景中做出假设,让这个问题变得更简单,那么您也许能够消除一些误报。其他改善结果的方法,以及每个自动驾驶辅助系统所做的,是融合不同的传感器信息来帮助视觉系统。大多数使用 LIDAR 和 RADAR 为相机提供要查看的位置,这有助于提高算法的性能和速度。

因此,如您所见,它非常依赖于应用程序。如果您的应用程序应该在一个简单的场景中工作,那么背景减法算法将有助于消除错误检测。您还可以 bootstrap 您的分类器使用错误检测的数据来提高其性能。

但要知道一件事:Computer-Vision 中没有 100%,无论您尝试多少。它总是在接受误报和系统健壮性之间取得平衡。

干杯。

编辑:回答标题的问题,为什么背景 objects 被检测为人?因为 HOG 完全是关于评估图像的边缘,所以您可能会将 HOG 特征发送到 SVM,对吗?在您提供的图像中检测到的垂直杆与人类共享一些视觉属性,例如它的垂直边缘。这就是为什么这些算法在交通标志和其他垂直元素上失败很多,正如你在我关于这个主题的硕士论文中看到的那样:Visual Pedestrian Detection using Integral Channels for ADAS