Backbone 对象检测中的网络

Backbone network in Object detection

我正在尝试了解对象删除深度学习算法的训练过程,但我在理解 backbone 网络(执行特征提取的网络)的训练方式时遇到了一些问题。

我知道使用 AlexNet、VGGNet 和 ResNet 等 CNN 很常见,但我不明白这些网络是否经过预训练。如果他们没有接受过培训,培训内容是什么?

我们直接使用预训练的 VGGNet 或 ResNet backbone。尽管 backbone 是为 classification 任务预训练的,隐藏层学习的特征也可用于对象检测。初始层将学习低级特征,例如直线、点、曲线等。下一层将学习构建在低级特征之上的高级特征,以检测图像中的对象和更大的形状。

然后修改最后一层以输出对象检测坐标而不是class。

也有特定于对象检测的 backbone。检查这些论文:

最后,预训练权重只有在将它们用于相似图像时才有用。例如:在 Image-net 上训练的权重对超声医学图像数据将毫无用处。在这种情况下,我们宁愿从头开始训练。