使用 Q-learning 时,我可以在我的普通家用电脑上处理多少种状态?

How many states could I work with on my ordinary home computer when using Q-learning?

当我想实现 Q-Learning 等强化学习算法时,我可以在普通家用计算机上处​​理多少个状态?一千,一百万,更多?

很多州 运行 非常不建议这样做。原因很简单——当内存中有很多状态时,当GPU找到状态及其对应的动作时,游戏已经改变到另一个状态。

所以解决方案是使用比朴素的 Q 学习更高级的东西。请参阅深度 Q 学习和其他流行的 RL 变体,如 A3C。他们有助于避免这个问题