如何快速验证 CNN 是否真正学习?

How one can quickly verify that a CNN actually learns?

我尝试从头开始构建基于 LeNet 架构的 CNN article

我实现了背景,现在尝试使用批量大小为 16 的 SGD 在 MNIST 数据集上对其进行训练。我想找到一种快速的方法来验证学习是否顺利并且没有错误。为此,我可视化了每 100 个批次的损失,但在我的笔记本电脑上花费的时间太长,而且我看不到整体动态(损失向下波动,但偶尔会跳回来,所以我不确定)。谁能提出一种行之有效的方法来发现 CNN 运行良好而无需等待数小时的训练?

MNIST 由 28 * 28 pixel.Training 的 60k 个数据集组成,批量大小为 16 的 CNN 每个时期将有 4000 次前向传递。 现在考虑到您使用的 LeNet 不是一个很深的模型。 我建议您执行以下操作:

  1. 检查您的 PC 规格,例如 RAM、处理器、GPU 等
  2. 尝试在 Google Colab、Kaggle 等云服务上训练模型
  3. 尝试批量大小为 128 或 64
  4. 训练前尝试规范化图像数据集

训练速度还取决于您使用的机器学习框架,例如 Tensorflow、Pytorch 等。 我希望这会有所帮助。