高纵横比物体的物体检测
object detection of a high aspect ratio object
我想训练一个用于对象检测的深度学习模型(比如 SSD 或 yolo)。我要检测的物体具有非常高的纵横比,比如一支铅笔。我希望输出边界框尽可能靠近具有相似纵横比的对象。我应该如何为此优化模型?我应该优化预定义框的所有纵横比以使它们更接近真实对象吗?就我而言,对象始终处于一个方向。谢谢
是的,最好使用 anchors/default 个纵横比与您在数据中看到的相似的方框。
例如,如果您使用 TF 对象检测 API,每个模型都包含一个具有不同模型配置的配置文件。
即:https://github.com/tensorflow/models/blob/master/research/object_detection/configs/tf2/ssd_mobilenet_v2_320x320_coco17_tpu-8.config
ssd_anchor_generator {
num_layers: 6
min_scale: 0.2
max_scale: 0.95
aspect_ratios: 1.0
aspect_ratios: 2.0
aspect_ratios: 0.5
aspect_ratios: 3.0
aspect_ratios: 0.3333
}
}
通常长宽比指的是width/height
的结果
所以,如果你只想要类似风景的物体,你只需要保持宽高比大于 1 (2.0,3.0)
另外,为了强调这一点,给出了与你期望的相似的长宽比,可以在文献中看到。
例如——YOLOV3 文章 (https://arxiv.org/pdf/1804.02767.pdf)
在 yolov3 - Redmond 在分析了 coco 中最可能的对象形状后选择了锚点。
我想训练一个用于对象检测的深度学习模型(比如 SSD 或 yolo)。我要检测的物体具有非常高的纵横比,比如一支铅笔。我希望输出边界框尽可能靠近具有相似纵横比的对象。我应该如何为此优化模型?我应该优化预定义框的所有纵横比以使它们更接近真实对象吗?就我而言,对象始终处于一个方向。谢谢
是的,最好使用 anchors/default 个纵横比与您在数据中看到的相似的方框。
例如,如果您使用 TF 对象检测 API,每个模型都包含一个具有不同模型配置的配置文件。
即:https://github.com/tensorflow/models/blob/master/research/object_detection/configs/tf2/ssd_mobilenet_v2_320x320_coco17_tpu-8.config
ssd_anchor_generator {
num_layers: 6
min_scale: 0.2
max_scale: 0.95
aspect_ratios: 1.0
aspect_ratios: 2.0
aspect_ratios: 0.5
aspect_ratios: 3.0
aspect_ratios: 0.3333
}
}
通常长宽比指的是width/height
的结果
所以,如果你只想要类似风景的物体,你只需要保持宽高比大于 1 (2.0,3.0)
另外,为了强调这一点,给出了与你期望的相似的长宽比,可以在文献中看到。
例如——YOLOV3 文章 (https://arxiv.org/pdf/1804.02767.pdf)
在 yolov3 - Redmond 在分析了 coco 中最可能的对象形状后选择了锚点。