openai-gym 如何确定观察值 space 的含义
openai-gym how to determine what the values in observation space mean
是否有任何文档可以详细说明此类内容?
例如:
import gym
# environment for agent
env = gym.make('Pendulum-v0')
env.reset()
print(env.observation_space.high, env.observation_space.low)
# pendulum observation space ranges from [-1, -1, -8] to [1, 1, 8]
我无法弄清楚观察 space 中每个数字的含义。我猜其中两个是x和y坐标(虽然我不知道哪个是哪个),第三个数字代表什么?
显然 openai
的 github 页面有一个 wiki,其中包含我正在寻找的信息:https://github.com/openai/gym/wiki
Open AI 的文档涵盖以下内容:
所有环境的观察维度space、行动space、奖励等:
https://github.com/openai/gym/wiki/Table-of-environments
-
在你的例子中,假设 Pendulum-v0 共享 v1 的特征,你的三个值意味着:
- cos(theta),介于 -1 和 1 之间
- sin(theta),介于 -1 和 1 之间
- theta 点,或 angular 速度,介于 -8 和 8 之间
最佳
是否有任何文档可以详细说明此类内容? 例如:
import gym
# environment for agent
env = gym.make('Pendulum-v0')
env.reset()
print(env.observation_space.high, env.observation_space.low)
# pendulum observation space ranges from [-1, -1, -8] to [1, 1, 8]
我无法弄清楚观察 space 中每个数字的含义。我猜其中两个是x和y坐标(虽然我不知道哪个是哪个),第三个数字代表什么?
显然 openai
的 github 页面有一个 wiki,其中包含我正在寻找的信息:https://github.com/openai/gym/wiki
Open AI 的文档涵盖以下内容:
所有环境的观察维度space、行动space、奖励等: https://github.com/openai/gym/wiki/Table-of-environments
在你的例子中,假设 Pendulum-v0 共享 v1 的特征,你的三个值意味着:
- cos(theta),介于 -1 和 1 之间
- sin(theta),介于 -1 和 1 之间
- theta 点,或 angular 速度,介于 -8 和 8 之间
最佳