高纵横比物体的物体检测

object detection of a high aspect ratio object

我想训练一个用于对象检测的深度学习模型(比如 SSD 或 yolo)。我要检测的物体具有非常高的纵横比,比如一支铅笔。我希望输出边界框尽可能靠近具有相似纵横比的对象。我应该如何为此优化模型?我应该优化预定义框的所有纵横比以使它们更接近真实对象吗?就我而言,对象始终处于一个方向。谢谢

是的,最好使用 anchors/default 个纵横比与您在数据中看到的相似的方框。

例如,如果您使用 TF 对象检测 API,每个模型都包含一个具有不同模型配置的配置文件。
即:https://github.com/tensorflow/models/blob/master/research/object_detection/configs/tf2/ssd_mobilenet_v2_320x320_coco17_tpu-8.config

  ssd_anchor_generator {
    num_layers: 6
    min_scale: 0.2
    max_scale: 0.95
    aspect_ratios: 1.0
    aspect_ratios: 2.0
    aspect_ratios: 0.5
    aspect_ratios: 3.0
    aspect_ratios: 0.3333
  }
}

通常长宽比指的是width/height
的结果 所以,如果你只想要类似风景的物体,你只需要保持宽高比大于 1 (2.0,3.0)

另外,为了强调这一点,给出了与你期望的相似的长宽比,可以在文献中看到。 例如——YOLOV3 文章 (https://arxiv.org/pdf/1804.02767.pdf)

在 yolov3 - Redmond 在分析了 coco 中最可能的对象形状后选择了锚点。