高纵横比物体的物体检测

Question

我想训练一个用于对象检测的深度学习模型（比如 SSD 或 yolo）。我要检测的物体具有非常高的纵横比，比如一支铅笔。我希望输出边界框尽可能靠近具有相似纵横比的对象。我应该如何为此优化模型？我应该优化预定义框的所有纵横比以使它们更接近真实对象吗？就我而言，对象始终处于一个方向。谢谢

Answer 1

是的，最好使用 anchors/default 个纵横比与您在数据中看到的相似的方框。

例如，如果您使用 TF 对象检测 API，每个模型都包含一个具有不同模型配置的配置文件。
即：https://github.com/tensorflow/models/blob/master/research/object_detection/configs/tf2/ssd_mobilenet_v2_320x320_coco17_tpu-8.config

  ssd_anchor_generator {
    num_layers: 6
    min_scale: 0.2
    max_scale: 0.95
    aspect_ratios: 1.0
    aspect_ratios: 2.0
    aspect_ratios: 0.5
    aspect_ratios: 3.0
    aspect_ratios: 0.3333
  }
}

通常长宽比指的是width/height
的结果所以，如果你只想要类似风景的物体，你只需要保持宽高比大于 1 (2.0,3.0)

另外，为了强调这一点，给出了与你期望的相似的长宽比，可以在文献中看到。例如——YOLOV3 文章 (https://arxiv.org/pdf/1804.02767.pdf)

在 yolov3 - Redmond 在分析了 coco 中最可能的对象形状后选择了锚点。

高纵横比物体的物体检测

object detection of a high aspect ratio object

object-detection

deep-learning

yolo