为什么开放健身房AI总是需要设置env.seed(#)?

Why do we always need to set env.seed(#) for open gym ai?

我第一手发现所有的强化学习算法都需要设置env.seed(#),我想知道背后的原因。

非常感谢!

我工作过的所有健身房环境都使用了numpy's random number generator。您当然不需要自己播种,因为它会回退到当前时钟时间播种。每当您担心再现性时,都会手动指定种子。如果你不给你的 RNG 相同的种子,它会产生不同的随机数序列。由于机器学习是由经验驱动的,因此可重复性非常重要。