OpenAI Gym:理解 `action_space` 符号 (spaces.Box)

OpenAI Gym: Understanding `action_space` notation (spaces.Box)

我想在 OpenAI CarRacing-v0 环境中设置一个 RL 代理,但在此之前我想了解操作 space。在 the code on github 行 119 中说:

self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1]))  # steer, gas, brake

如何阅读这一行?虽然我的问题很具体 CarRacing-v0 我想了解 spaces.Box() 一般的表示法

Box 表示您正在处理实数值。

第一个数组 np.array([-1,0,0] 是最低接受值,第二个 np.array([+1,+1,+1]) 是最高接受值。在这种情况下(使用评论)我们看到我们有 3 个可用的操作:

  1. 转向[-1, 1]
  2. 中的真实值
  3. Gas[0, 1]
  4. 中的真实值
  5. Brake: [0, 1]
  6. 中的真实值