Keras 获取 VGG 中特定图像最后一层的特征图

Question

我有几张图片。我想使用 VGG 为每个获取 4096 的一维特征图，类似于此处所做的：（他们有 700 张图像作为输入。他们从 VGG16 中删除了最后一个全连接层，因此，VGGNet 包括 13 个卷积层（Conv）、5 个最大池化层和 2 个全连接层层 (Fc)，生成一个 700 × 4096 的特征图作为其输出）

最好的方法是什么？（请注意，我只需要 PS 的上半部分 - 为每个图像生成一个 1X4096 向量。连接目前并不重要）

Answer 1

考虑到以下限制，这应该足够了：

您的网络不是完全卷积的，您将无法更改输入大小。
您的网络可能对一些空间信息进行了编码（因为您正在将网格转换为展平矢量）。

这并不是说这个概念是错误的还是不正确的。例如，在某些情况下，对位置进行编码很重要。在其他一些地方，使用不同大小的图像很有趣，例如在多个尺度和平均结果下进行推断。

要在 Keras 中执行此操作，您只需要原始的 VGG 模型。您可以创建新的：

model_base = tf.keras.applications.VGG16(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
)

new_input = model_base.input
new_output = model_base.get_layer('fc2').output
model = tf.keras.Model(new_input, new_output)

这是一种非常普遍的提取特征的方式，根据你的兴趣你可以保留或不保留FC。比如你分析keras原代码：https://github.com/keras-team/keras-applications/blob/master/keras_applications/vgg16.py，你会发现如果你指明include_top=False，FC部分会被去掉（称为分类），只有特征提取部分+ 将保留全局平均池。

更新：

VGG 不编码空间输入吗？是否有其他 pre-trained 网络在维护它？

VGG 与 fully-connected YES 一起在分类层中编码空间信息。这意味着最后一层，例如，如果预测取决于检测上方的天空，它是可以预期的。可能发生在你身上的相反情况是，如果你想将左上角有一只猫的大图像分类为猫，而你只用右边的猫图像进行训练，那么你可能会遇到空间信息问题。但是，还有其他方法可以对空间信息进行编码。 fully-convolutional 网络的最大好处是您可以使用不同尺寸的图像。这取决于问题，目前 fully-convolutional 网络使用很多，这意味着没有从网格到扁平向量的转换。否则整个图像被平均，因此空间信息丢失。这是现在的标准。

include_top = False 对生成的特征图有什么影响？

如果它会影响，include_top = True，您将保留所有 fully-connected 层，然后保留 fc2 (https://neurohive.io/wp-content/uploads/2018/11/vgg16.png)。如果你设置 include_top = False，你将移除 FC 并放置一层全局平均池化，它将对所有特征进行平均。

最好的解决方案是什么？没有更好的解决方案，这取决于你的问题，通常不是那么重要。

Keras 获取 VGG 中特定图像最后一层的特征图

Keras get feature map of last layer for a specific image in VGG

deep-learning

keras

keras-layer

vgg-net

tf.keras