为什么我的验证损失低于训练损失?

Why is my validation loss lower than my training loss?

为什么我的验证损失低于训练损失?我想知道这些曲线是否可以接受。我不知道那些曲线是不是真的。

这种情况在现实世界的数据集中很少发生,但是,有可能发生,例如,考虑验证数据集和训练具有大致相同的分布,训练集噪声更大比验证数据集,在这种情况下,你所展示的学习是可能的。

这种情况背后的一般粗略原因是您的训练集与验证集相比过于复杂。

考虑到您使用 deep-learning 作为标签,我什至会考虑 dropout 正则化层的影响。有关理论讨论,请参阅 this post