使用大量图像训练强化学习模型

Train a reinforcement learning model with a large amount of images

我正在尝试训练一个深度强化学习模型来完成迷宫逃脱任务,每次都以一张图像作为输入(例如,不同的"maze")。

假设我有大约 10K 个不同的迷宫图像,理想情况是在训练 N 个迷宫后,我的模型可以很好地快速解决其余 10K - N 个图像中的拼图。

我写信是想询问一些关于如何 select 训练任务的好 N 的好 idea/empirical 证据。

一般来说,我应该如何估计和增强我的强化模型"transfer learning"的能力?让它更通用?

如有任何意见或建议,我们将不胜感激。谢谢。

首先,

我强烈建议您使用 2D 数组 作为迷宫地图而不是 images,它会使您的模型变得巨大赞成,因为这是一种提取更多特征的方法。尝试使用 2D 阵列,其中墙壁由零点地面上的一个显示。

关于找到优化的 N:

您的模型架构比所有数据中训练数据的份额或批量大小重要得多。最好做一个设计好的模型,然后通过测试不同的N来找到N的优化量(因为它只是一个变量,优化N的过程你自己可以很容易地完成)。