为什么物体检测 CNN 的边界框必须与图像边界平行?
Why does the bounding box of an object detection CNN has to be parallel to the image borders?
查看利用深度学习进行对象识别的最新进展,例如 MASK-RCNN or YOLO 我注意到对象的边界框始终与图像边界平行。
这仅仅是因为提供的训练数据的符号,例如 COCO,还是因为底层架构。查看 Yolo 或 RCNN 的最后一层 - 是否可以在像图像中的对象一样旋转的矩形上进行训练?
这些模型通常会预测 x 和 y 中的中心点,以及宽度和高度。这解释了一致的结果。如果训练数据提供另一种形式的标签,应该也可以很容易地学习其他边界框。
查看利用深度学习进行对象识别的最新进展,例如 MASK-RCNN or YOLO 我注意到对象的边界框始终与图像边界平行。
这仅仅是因为提供的训练数据的符号,例如 COCO,还是因为底层架构。查看 Yolo 或 RCNN 的最后一层 - 是否可以在像图像中的对象一样旋转的矩形上进行训练?
这些模型通常会预测 x 和 y 中的中心点,以及宽度和高度。这解释了一致的结果。如果训练数据提供另一种形式的标签,应该也可以很容易地学习其他边界框。