全局平均池化后的全连接层如何在 Resnet50 中工作?
How fully connected layer after global average pooling works in Resnet50?
我有 resnet50 网络,顶层包括形状为 (1, 2048) 的全局平均池和使用形状为 (1, 3) 的 softmax 的密集层。全局平均池化层的 (1,2048) 输出形状如何变为密集层输出的 (1, 3)?它是如何工作的?我找不到可靠的来源来解释这个
密集层或全连接层只是矩阵乘法(有偏差)。所以你要做的是将一个形状为 1x2048
的矩阵与另一个形状为 2048x3
的矩阵相乘,得到一个形状为 1x3
的输出矩阵,它为你的 3 类 提供分数。 Softmax 将这些分数转换为概率。当然,您的网络使用反向传播来学习这些矩阵的权重。
我有 resnet50 网络,顶层包括形状为 (1, 2048) 的全局平均池和使用形状为 (1, 3) 的 softmax 的密集层。全局平均池化层的 (1,2048) 输出形状如何变为密集层输出的 (1, 3)?它是如何工作的?我找不到可靠的来源来解释这个
密集层或全连接层只是矩阵乘法(有偏差)。所以你要做的是将一个形状为 1x2048
的矩阵与另一个形状为 2048x3
的矩阵相乘,得到一个形状为 1x3
的输出矩阵,它为你的 3 类 提供分数。 Softmax 将这些分数转换为概率。当然,您的网络使用反向传播来学习这些矩阵的权重。