计算机视觉 - 是否需要具有具有特定视点的多个分类器来进行物体检测?

Computer Vision - Is it necessary to have multi classifiers with certain viewpoint for object detection?

假设我想训练一个 HOG 描述符 + 线性 SVM 用于汽车检测。我是否有必要制作三个分类器,即汽车的后视图、前视图和侧视图,或者我可以只为汽车的所有视点训练一个分类器?

这不是必需的,但建议这样做。你可以制作一个处理多种情况的分类器,但它的整体表现不会很好。这里的问题与其说是不同视图之间描述符响应的可变性,不如说是 rear/front-facing 和侧面检测器之间纵横比的差异。用于提取 HOG 的滑动 window 将捕获过多的负面数据(侧视图大小超过 rear/front)或正数据不足(rear/front 大小超过侧视图)。

底线:这取决于您的 accuracy/processing 费率要求。根据我的经验 front/rear 通常足够相似,但如果需要高精度,则每个都需要一个单独的检测器。您肯定需要一个单独的侧面探测器,甚至可能需要专用的 'quarter view' 探测器 - 右前、左前、右后、左后。

P.S。我忽略了您还需要处理多个尺度的事实。