物体检测模型可以适应旋转吗?

Can object detection models adapt to rotation?

即使训练图像中未包含旋转版本,TensorFlow 对象检测模型也会输出正确的边界框预测。

这是对象检测模型的常规行为吗?如果是这样,是什么(代码或概念的一部分)确保了这种适应?

可以模拟旋转不变性的最简单方法是通过数据集扩充,其中输入图像在每次以不同的量传递到网络之前被人工旋转。

旋转通常被限制在某个较小的值 - 例如-3030 度 - 而不是完全随机,因为图像通常有一些标准方向,并且场景中的 space 通常不是各向同性的(即由于重力,向上与横向不同) .

请注意,这些增强不会使网络具有固有的旋转不变性。但是,如果网络学习得很好,它应该学习近似旋转不变性。

其他形式的增强包括左右翻转(但不是上下翻转,原因与上述相同)、调整大小和光度变化,如 hue/saturation/contrast 操作。在某些情况下,其中一些(或全部)是不合适的。例如,对于手写识别,符号本质上是不对称的,因此左右翻转是不合适的。