减少神经网络特征图的空间维度
Reducing the Spatial Dimensions of a Neural Network Feature Map
给定维度 MxNxC
的特征图(例如,来自 Faster-RCNN 的预测感兴趣区域的输出),如何减少 spatial 尺寸为 1x1xC
? IE。将特征图缩减为向量,如数量汇总区域的特征?
我知道 1x1
卷积,但这似乎与 通道缩减 案例相关。 Average 和 Max Pooling 也很常用,但似乎这些方法更适合不太极端的子采样情况。
显然,人们可以简单地计算空间维度上的平均值,但这似乎相当粗糙。
我推荐使用全局平均池化层。你有 MxNxC 特征图。全局平均池计算每个特征图的平均值。所以特征图变成一个数字,一组特征图变成向量。
我推荐这篇文章作为探索全局平均池化层的起点。
https://alexisbcook.github.io/2017/global-average-pooling-layers-for-object-localization/
给定维度 MxNxC
的特征图(例如,来自 Faster-RCNN 的预测感兴趣区域的输出),如何减少 spatial 尺寸为 1x1xC
? IE。将特征图缩减为向量,如数量汇总区域的特征?
我知道 1x1
卷积,但这似乎与 通道缩减 案例相关。 Average 和 Max Pooling 也很常用,但似乎这些方法更适合不太极端的子采样情况。
显然,人们可以简单地计算空间维度上的平均值,但这似乎相当粗糙。
我推荐使用全局平均池化层。你有 MxNxC 特征图。全局平均池计算每个特征图的平均值。所以特征图变成一个数字,一组特征图变成向量。
我推荐这篇文章作为探索全局平均池化层的起点。
https://alexisbcook.github.io/2017/global-average-pooling-layers-for-object-localization/