NN 中的 Train loss、Valid loss 和 Train/Val 是什么意思
What is Train loss, Valid loss, and Train/Val mean in NNs
我目前正在通过研究 MNIST 示例等示例来学习卷积神经网络。在神经网络的训练过程中,我经常看到这样的输出:
Epoch | Train loss | Valid loss | Train / Val
--------|--------------|--------------|---------------
50 | 0.004756 | 0.007043 | 0.675330
100 | 0.004440 | 0.005321 | 0.834432
250 | 0.003974 | 0.003928 | 1.011598
500 | 0.002574 | 0.002347 | 1.096366
1000 | 0.001861 | 0.001613 | 1.153796
1500 | 0.001558 | 0.001372 | 1.135849
2000 | 0.001409 | 0.001230 | 1.144821
2500 | 0.001295 | 0.001146 | 1.130188
3000 | 0.001195 | 0.001087 | 1.099271
除了纪元之外,有人可以解释一下每一列究竟代表什么以及这些值的含义吗?我看到很多关于基本 cnn 的教程,但我没有 运行 详细解释这一点。
除了用于训练网络的数据外,似乎还使用了一组保留的数据。训练损失是训练数据集的误差。验证损失是 运行 通过训练网络验证数据集后的错误。 Train/valid是两者的比值。
出乎意料的是,随着时代的增加,验证和训练误差都下降了。但是在某个时刻,虽然训练误差继续下降(网络对数据的学习越来越好),但验证误差开始上升——这就是 overfitting
!
我目前正在通过研究 MNIST 示例等示例来学习卷积神经网络。在神经网络的训练过程中,我经常看到这样的输出:
Epoch | Train loss | Valid loss | Train / Val
--------|--------------|--------------|---------------
50 | 0.004756 | 0.007043 | 0.675330
100 | 0.004440 | 0.005321 | 0.834432
250 | 0.003974 | 0.003928 | 1.011598
500 | 0.002574 | 0.002347 | 1.096366
1000 | 0.001861 | 0.001613 | 1.153796
1500 | 0.001558 | 0.001372 | 1.135849
2000 | 0.001409 | 0.001230 | 1.144821
2500 | 0.001295 | 0.001146 | 1.130188
3000 | 0.001195 | 0.001087 | 1.099271
除了纪元之外,有人可以解释一下每一列究竟代表什么以及这些值的含义吗?我看到很多关于基本 cnn 的教程,但我没有 运行 详细解释这一点。
除了用于训练网络的数据外,似乎还使用了一组保留的数据。训练损失是训练数据集的误差。验证损失是 运行 通过训练网络验证数据集后的错误。 Train/valid是两者的比值。
出乎意料的是,随着时代的增加,验证和训练误差都下降了。但是在某个时刻,虽然训练误差继续下降(网络对数据的学习越来越好),但验证误差开始上升——这就是 overfitting
!