Backbone 对象检测中的网络

Backbone network in Object detection

我正在尝试了解对象删除深度学习算法的训练过程，但我在理解 backbone 网络（执行特征提取的网络）的训练方式时遇到了一些问题。

我知道使用 AlexNet、VGGNet 和 ResNet 等 CNN 很常见，但我不明白这些网络是否经过预训练。如果他们没有接受过培训，培训内容是什么？

我们直接使用预训练的 VGGNet 或 ResNet backbone。尽管 backbone 是为 classification 任务预训练的，隐藏层学习的特征也可用于对象检测。初始层将学习低级特征，例如直线、点、曲线等。下一层将学习构建在低级特征之上的高级特征，以检测图像中的对象和更大的形状。

然后修改最后一层以输出对象检测坐标而不是class。

也有特定于对象检测的 backbone。检查这些论文：

最后，预训练权重只有在将它们用于相似图像时才有用。例如：在 Image-net 上训练的权重对超声医学图像数据将毫无用处。在这种情况下，我们宁愿从头开始训练。