解释验证损失

Interpret validation Loss

我是神经网络的新手,我不知道如何解释我得到的验证损失结果。我正在尝试使用 tensorflow 对图像进行分类。如果我绘制每个纪元后得到的结果,我会得到以下结果: enter image description here

我的训练准确率和验证准确率提高了,我的训练损失减少了,但验证损失虽然下降了一些,但与训练损失不太接近。

我该如何解读?我不明白验证损失的变化。验证损失没有减少训练损失那么多这一事实是否意味着我有过度拟合?

(以防万一,我正在做 25 个 epochs,batch size:128,Learning rate:0.0001 and training/validation split: 0.4)

感谢帮助

验证损失的激增并不少见,尤其是在早期阶段。通常,过拟合表示您的训练损失减少但验证损失平台随后开始增加每个时期的情况。一般来说,训练精度通常高于验证精度,训练损失低于验证损失。您可以做几件事来帮助改善验证损失。如果模型过度拟合,则添加 dropout 层,或者如果你有多个隐藏的密集层,最初只使用 1,然后如果训练精度差,则添加更多。模型越不复杂,过度拟合的可能性就越小。使用可调节的学习率也有帮助。可以设置 Keras 回调 ReduceLROnPlateau 来监控验证损失并在损失未能减少时降低学习率。文档是 here. Use the callback ModelCheckpoint to save the model with the lowest validation loss and use that model to make predictions on the test set. Documentation is here.