为什么要拆开 openAI 健身房?

Why unwrap an openAI gym?

我试图在使用 openAI gym 作为学习环境的同时获得一些关于强化学习的见解。我通过阅读 Hands-on reinforcement learning with Python 这本书来做到这一点。本书提供了一些代码。通常,代码不起作用,因为我必须先解包它,如下所示:

但是,我个人仍然对这种展开的原因感兴趣。为什么需要解包?这到底是做什么的?为什么它不像书中那样编码?是否像 Giuliov 假设的那样是过时的软件?

提前致谢。

Open AI Gym 提供了许多不同的环境。他们每个人都有自己的一组参数和方法。然而,它们通常由一个名为 Env 的 Class(就像真正的 OOPL 上的接口)包装。 class 公开了任何环境中最常见的最基本方法,例如 stepresetseed。拥有这个“接口”class 很棒,因为它允许您的代码与环境无关。如果您想在不同的环境中测试单个代理,这也会使事情变得更容易。

但是,如果您想访问特定环境的背后-the.scenes 动态,那么您可以使用 unwrapped 属性.