如何快速验证 CNN 是否真正学习?
How one can quickly verify that a CNN actually learns?
我尝试从头开始构建基于 LeNet 架构的 CNN article
我实现了背景,现在尝试使用批量大小为 16 的 SGD 在 MNIST 数据集上对其进行训练。我想找到一种快速的方法来验证学习是否顺利并且没有错误。为此,我可视化了每 100 个批次的损失,但在我的笔记本电脑上花费的时间太长,而且我看不到整体动态(损失向下波动,但偶尔会跳回来,所以我不确定)。谁能提出一种行之有效的方法来发现 CNN 运行良好而无需等待数小时的训练?
MNIST 由 28 * 28 pixel.Training 的 60k 个数据集组成,批量大小为 16 的 CNN 每个时期将有 4000 次前向传递。
现在考虑到您使用的 LeNet 不是一个很深的模型。
我建议您执行以下操作:
- 检查您的 PC 规格,例如 RAM、处理器、GPU 等
- 尝试在 Google Colab、Kaggle 等云服务上训练模型
- 尝试批量大小为 128 或 64
- 训练前尝试规范化图像数据集
训练速度还取决于您使用的机器学习框架,例如 Tensorflow、Pytorch 等。
我希望这会有所帮助。
我尝试从头开始构建基于 LeNet 架构的 CNN article
我实现了背景,现在尝试使用批量大小为 16 的 SGD 在 MNIST 数据集上对其进行训练。我想找到一种快速的方法来验证学习是否顺利并且没有错误。为此,我可视化了每 100 个批次的损失,但在我的笔记本电脑上花费的时间太长,而且我看不到整体动态(损失向下波动,但偶尔会跳回来,所以我不确定)。谁能提出一种行之有效的方法来发现 CNN 运行良好而无需等待数小时的训练?
MNIST 由 28 * 28 pixel.Training 的 60k 个数据集组成,批量大小为 16 的 CNN 每个时期将有 4000 次前向传递。 现在考虑到您使用的 LeNet 不是一个很深的模型。 我建议您执行以下操作:
- 检查您的 PC 规格,例如 RAM、处理器、GPU 等
- 尝试在 Google Colab、Kaggle 等云服务上训练模型
- 尝试批量大小为 128 或 64
- 训练前尝试规范化图像数据集
训练速度还取决于您使用的机器学习框架,例如 Tensorflow、Pytorch 等。 我希望这会有所帮助。