使用 Q-learning 时，我可以在我的普通家用电脑上处理多少种状态？

How many states could I work with on my ordinary home computer when using Q-learning?

当我想实现 Q-Learning 等强化学习算法时，我可以在普通家用计算机上处理多少个状态？一千，一百万，更多？

很多州运行非常不建议这样做。原因很简单——当内存中有很多状态时，当GPU找到状态及其对应的动作时，游戏已经改变到另一个状态。

所以解决方案是使用比朴素的 Q 学习更高级的东西。请参阅深度 Q 学习和其他流行的 RL 变体，如 A3C。他们有助于避免这个问题