与带池化的 CNN 相比,全卷积神经网络有哪些优势?

What are the benefits of fully convolutional neural networks, compared to CNNs with pooling?

我已经阅读了一些关于用于对象检测的不同 CNN 的资料,发现我正在查看的大多数模型都是全卷积网络,例如最新的 YOLO 版本和 retinanet。

除了 FCN 具有更少的不同层之外,FCN 与带池化的传统 CNN 相比有哪些优势?我读过 https://arxiv.org/pdf/1412.6806.pdf 并且当我阅读它时,该论文的主要兴趣是简化网络结构。这是现代 detection/classification 网络不使用池的唯一原因,还是有其他好处?

对于 FCN,我们避免使用密集层,这意味着参数更少,因此我们可以使网络学习得更快。

如果您避免合并,您的输出将与您的输入相同 height/width。但我们的目标是减少卷积的大小,因为它的计算效率更高。此外,通过池化,我们可以更深入,因为我们通过更高层的单个神经元“看到”更多的输入。此外,它有助于跨不同尺度传播信息。

通常这些网络包含一个用于提取所有必要特征的下采样路径和一个用于将高级特征重建回原始图像尺寸的上采样路径。

有一些架构像“全卷积网络”。 Springenberg,这在某种意义上避免了汇集,以支持速度和简单性。在这篇论文中,作者用 stride-2 卷积替换了所有池化操作,并在输出层使用了全局平均池化。全局平均池化操作降低了给定输入的维度。