OpenAI Gym:理解 `action_space` 符号 (spaces.Box)
OpenAI Gym: Understanding `action_space` notation (spaces.Box)
我想在 OpenAI CarRacing-v0
环境中设置一个 RL 代理,但在此之前我想了解操作 space。在 the code on github 行 119 中说:
self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake
如何阅读这一行?虽然我的问题很具体 CarRacing-v0
我想了解 spaces.Box()
一般的表示法
Box
表示您正在处理实数值。
第一个数组 np.array([-1,0,0]
是最低接受值,第二个 np.array([+1,+1,+1])
是最高接受值。在这种情况下(使用评论)我们看到我们有 3 个可用的操作:
- 转向:
[-1, 1]
中的真实值
- Gas:
[0, 1]
中的真实值
- Brake:
[0, 1]
中的真实值
我想在 OpenAI CarRacing-v0
环境中设置一个 RL 代理,但在此之前我想了解操作 space。在 the code on github 行 119 中说:
self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake
如何阅读这一行?虽然我的问题很具体 CarRacing-v0
我想了解 spaces.Box()
一般的表示法
Box
表示您正在处理实数值。
第一个数组 np.array([-1,0,0]
是最低接受值,第二个 np.array([+1,+1,+1])
是最高接受值。在这种情况下(使用评论)我们看到我们有 3 个可用的操作:
- 转向:
[-1, 1]
中的真实值
- Gas:
[0, 1]
中的真实值
- Brake:
[0, 1]
中的真实值