为什么要拆开 openAI 健身房？

Why unwrap an openAI gym?

我试图在使用 openAI gym 作为学习环境的同时获得一些关于强化学习的见解。我通过阅读 Hands-on reinforcement learning with Python 这本书来做到这一点。本书提供了一些代码。通常，代码不起作用，因为我必须先解包它，如下所示：

但是，我个人仍然对这种展开的原因感兴趣。为什么需要解包？这到底是做什么的？为什么它不像书中那样编码？是否像 Giuliov 假设的那样是过时的软件？

提前致谢。

Open AI Gym 提供了许多不同的环境。他们每个人都有自己的一组参数和方法。然而，它们通常由一个名为 Env 的 Class（就像真正的 OOPL 上的接口）包装。 class 公开了任何环境中最常见的最基本方法，例如 step、reset 和 seed。拥有这个“接口”class 很棒，因为它允许您的代码与环境无关。如果您想在不同的环境中测试单个代理，这也会使事情变得更容易。

但是，如果您想访问特定环境的背后-the.scenes 动态，那么您可以使用 unwrapped 属性.

为什么要拆开 openAI 健身房？

Why unwrap an openAI gym?

reinforcement-learning

python-3.x

openai-gym