在 caffe 中测试回归网络

Question

我正在尝试使用 Alexnet 对图像中的对象进行计数。

我目前的图像每张图像包含 1、2、3 或 4 个对象。对于初始检查，我每个 class 有 10 张图片。例如在训练集中我有：

image  label
image1  1
image2  1
image3  1
...
image39 4
image40 4

我使用 imagenet 创建脚本为此数据集创建了一个 lmdb 文件。它成功地将我的图像集转换为 lmdb。 Alexnet，例如通过引入 EucledeanLosslayer 而不是 Softmax 层，转换为学习图像中对象数量的回归模型。正如许多人所建议的那样。网络的其余部分是相同的。

然而，尽管做了以上所有操作，当我运行模型时，我在测试阶段只收到零作为输出（如下所示）。它没有学到任何东西。然而，训练损失在每次迭代中不断下降。

我不明白我犯了什么错误。谁能指导我为什么预测值总是 0？以及如何在测试阶段检查回归值，以便检查有多少样本是正确的以及我的每张图像的价值是多少？

测试数据集的预测标签和实际标签如下：

I0928 17:52:45.585160 18302 solver.cpp:243] Iteration 1880, loss = 0.60498
I0928 17:52:45.585212 18302 solver.cpp:259]     Train net output #0: loss = 0.60498 (* 1 = 0.60498 loss)
I0928 17:52:45.585225 18302 solver.cpp:592] Iteration 1880, lr = 1e-06
I0928 17:52:48.397922 18302 solver.cpp:347] Iteration 1900, Testing net (#0)
I0928 17:52:48.499543 18302 accuracy_layer.cpp:88] Predicted_Value: 0 Actual Label: 1
I0928 17:52:48.499641 18302 accuracy_layer.cpp:88] Predicted_Value: 0 Actual Label: 2
I0928 17:52:48.499660 18302 accuracy_layer.cpp:88] Predicted_Value: 0 Actual Label: 3
I0928 17:52:48.499681 18302 accuracy_layer.cpp:88] Predicted_Value: 0 Actual Label: 4
...

注意：我还创建了 hdf5 格式文件以具有浮动标签，即 1.0、2.0、3.0 和 4.0。但是，当我将数据层更改为 HDF5 类型时，我无法像在带有 lmdb 层的 alexnet 中所做的那样裁剪图像以进行数据增强，以及规范化。我将“https://github.com/nikogamulin/caffe-utils/blob/master/hdf5/demo.m”上给出的脚本用于 hdf5 数据，并按照他的步骤在我的模型中使用它。

我已经更新了最后一层：

layer {
   name: "fc8reg"
   type: "InnerProduct"
   bottom: "fc7"
   top: "fc8reg"
   param {
    lr_mult: 1
    decay_mult: 1
   }
   param {
     lr_mult: 2
     decay_mult: 0
   }
   inner_product_param {
   num_output: 1
   weight_filler {
       type: "gaussian"
       std: 0.01
   }
   bias_filler {
       type: "constant"
       value: 0
   }
   }
 }
 layer {
   name: "accuracy"
   type: "Accuracy"
   bottom: "fc8reg"
   bottom: "label"
   top: "accuracy"
   include {
     phase: TEST
   }
 }
 layer {
   name: "loss"
   type: "EuclideanLoss"
   bottom: "fc8reg"
   bottom: "label"
   top: "loss"
 }

Answer 1

在我看来，一切都是正确的，但是你的网络不收敛，这种情况并不少见。您的网络实际上正在收敛到零输出！也许您的大多数样本都将 0 作为标签。

另外不要忘记仅在 TRAIN 期间包含损失层；否则，它也会学习测试数据。

Answer 2

在不判断您的网络是否发散的情况下，您所犯的明显错误是您不应该使用 Accuracy 层来测试回归网络。它仅用于测试由 SoftmaxWithLoss 层训练的分类网络。

事实上，给定一个网络图像，网络中的 Accuracy 层将始终对其输入数组进行排序（这里是 bottom: "fc8reg"）并选择最大值的索引默认情况下作为预测标签的数组。

由于 num_output == 1 在 fc8reg 层中，accuracy 层将始终预测输入图像的索引 0 作为其预测标签。

最后，您可以使用 EuclideanLoss 层来测试您的回归网络。这个也可以给你一些提示。

如果你要打印和计算训练后的回归值，并统计回归网络的准确率，你可以简单地写一个RegressionAccuracy层，如this。

或者，如果您的目标标签只有 4 个离散值 {1,2,3,4}，您仍然可以为您的任务训练分类网络。

在 caffe 中测试回归网络

Testing a regression network in caffe

regression

machine-learning

neural-network

caffe

conv-neural-network