在输入 L-SVM 之前,是否有必要对 CNN 的 FC7 特征应用均值减法?
Is it necessary to apply mean-subtraction on FC7 features of an CNN before feeding into L-SVM?
我想使用 AlexNet 的非自我特征在我自己的数据集上训练 L-SVM。我发现建议在将特征输入 SVM 分类器之前对其进行零均值处理。我只想知道在使用 CNN 功能时是否有必要这样做,因为在 CNN 的第一个数据层中,均值减法曾经应用于原始输入图像。
在使用 FC7 特征训练 SVM 之前,没有必要减去均值,但这不会有什么坏处。我不确定 L-SVM 是什么,但如果数据是 "somewhere around zero",这个答案应该适用于任何 SVM。
另一方面,将特征向量(FC7 激活)归一化 为单位长度 是个好主意(例如除法他们通过他们的 L1 或 L2 范数)。这种归一化通常会改善分类结果,并使 SVM 超参数的调整变得更加容易。
如何规范化 FC7 激活的决定不应该以任何方式取决于输入图像的平均减法。输入均值减法可能会改进网络的训练,但它不应影响网络在完全训练后的计算结果。请记住,图像均值是恒定的并且是在训练集上计算的 - 它以相同的方式影响所有图像。
我想使用 AlexNet 的非自我特征在我自己的数据集上训练 L-SVM。我发现建议在将特征输入 SVM 分类器之前对其进行零均值处理。我只想知道在使用 CNN 功能时是否有必要这样做,因为在 CNN 的第一个数据层中,均值减法曾经应用于原始输入图像。
在使用 FC7 特征训练 SVM 之前,没有必要减去均值,但这不会有什么坏处。我不确定 L-SVM 是什么,但如果数据是 "somewhere around zero",这个答案应该适用于任何 SVM。
另一方面,将特征向量(FC7 激活)归一化 为单位长度 是个好主意(例如除法他们通过他们的 L1 或 L2 范数)。这种归一化通常会改善分类结果,并使 SVM 超参数的调整变得更加容易。
如何规范化 FC7 激活的决定不应该以任何方式取决于输入图像的平均减法。输入均值减法可能会改进网络的训练,但它不应影响网络在完全训练后的计算结果。请记住,图像均值是恒定的并且是在训练集上计算的 - 它以相同的方式影响所有图像。