HOG Person Detector：为什么背景地面物体被检测为人？

HOG Person Detector: Why background ground objects are detected as people?

我正在从事一个涉及检测各种框架中的人的项目。检测器能够检测到帧序列中的大部分人。

但它有时会将静止的背景物体检测为人。我真的很想知道为什么会这样，以及检测器当前的工作如何导致这些误报。

如何消除这些误报？

误报检测示例：

正如this论文的作者在标题中暗示的那样："How Far are We from Solving Pedestrian Detection?"，我们还没有解决实际场景中视觉行人检测的问题，事实上，有人认为它会永远无法完全解决。

在城市场景中检测人物可能是计算机视觉中最困难的任务之一。场景中充斥着混乱、随机和不可预测的元素，行人可能被遮挡，他们可能隐藏在阴影中或摄像机无法看到的黑暗环境中。事实上，视觉行人检测仍然是迄今为止最重要的挑战之一。

而且您甚至没有使用最先进的方法，正如您在下图中看到的那样，自从 HOG 成为该任务的最佳算法以来已经有很长一段时间了。

（图片来自 Piotr Dollar、Christian Wojek、Bernt Schiele 和 Pietro Perona 的 "Pedestrian Detection: An Evaluation of the State of the Art"）

那篇论文已经有点过时了，但你会看到即使是性能最好的算法在图像数据集中仍然表现不佳，更不用说真实场景了。

那么，为了回答您的问题，您可以做些什么来提高它的性能？这取决于。如果您可以在您的特定场景中做出假设，让这个问题变得更简单，那么您也许能够消除一些误报。其他改善结果的方法，以及每个自动驾驶辅助系统所做的，是融合不同的传感器信息来帮助视觉系统。大多数使用 LIDAR 和 RADAR 为相机提供要查看的位置，这有助于提高算法的性能和速度。

因此，如您所见，它非常依赖于应用程序。如果您的应用程序应该在一个简单的场景中工作，那么背景减法算法将有助于消除错误检测。您还可以 bootstrap 您的分类器使用错误检测的数据来提高其性能。

但要知道一件事：Computer-Vision 中没有 100%，无论您尝试多少。它总是在接受误报和系统健壮性之间取得平衡。

干杯。

编辑：回答标题的问题，为什么背景 objects 被检测为人？因为 HOG 完全是关于评估图像的边缘，所以您可能会将 HOG 特征发送到 SVM，对吗？在您提供的图像中检测到的垂直杆与人类共享一些视觉属性，例如它的垂直边缘。这就是为什么这些算法在交通标志和其他垂直元素上失败很多，正如你在我关于这个主题的硕士论文中看到的那样：Visual Pedestrian Detection using Integral Channels for ADAS

HOG Person Detector：为什么背景地面物体被检测为人？

HOG Person Detector: Why background ground objects are detected as people?

opencv

computer-vision

detection