如果我不将默认输入形状放入预训练模型中,深度学习程序的准确性会下降吗?

Does the accuracy of the deep learning program drop if I do not put in the default input shape into the pretrained model?

正如标题所说,我想知道输入形状是否影响深度学习模型的准确性。

此外,pre-trained 模型(如 Xception)是否可以用于灰度图像?

P.S。 : 我最近开始学习深度学习所以如果可能的话请简单解释一下。

通常,对于卷积神经网络,图像形状(图像的 width/height)的差异无关紧要。然而,图像中通道数量的差异(相当于图像的深度)会影响性能。事实上,如果模型是为 greyscale/colour 训练的,而你输入了另一种类型,通常会出现维度不匹配错误。

通常,输入比例很重要。更改为灰度肯定很重要。细节取决于训练数据。也就是说,如果训练数据包含与您使用的比例相同的对象,则可能不会产生很大差异,否则就会产生差异。深度学习大多不会对数据的任何变化保持不变。 CNN 显示出一些平移不变性,但仅此而已。旋转、缩放、颜色失真、亮度等都会对性能产生负面影响 - 如果这些条件没有成为训练的一部分。

在 IJCNN 2022 上发表的论文 https://arxiv.org/abs/2106.06057 研究了在 MNIST(数字)等简单数据集上旋转和缩放图像的分类器,并表明性能下降很多。还有其他论文显示了同样的事情。