openai-gym 如何确定观察值 space 的含义

openai-gym how to determine what the values in observation space mean

是否有任何文档可以详细说明此类内容? 例如:

import gym

# environment for agent
env = gym.make('Pendulum-v0')
env.reset()

print(env.observation_space.high, env.observation_space.low)

# pendulum observation space ranges from [-1, -1, -8] to [1, 1, 8]

我无法弄清楚观察 space 中每个数字的含义。我猜其中两个是x和y坐标(虽然我不知道哪个是哪个),第三个数字代表什么?

显然 openai 的 github 页面有一个 wiki,其中包含我正在寻找的信息:https://github.com/openai/gym/wiki

Open AI 的文档涵盖以下内容:

  1. 所有环境的观察维度space、行动space、奖励等: https://github.com/openai/gym/wiki/Table-of-environments

  2. 它们的特定范围,例如 https://github.com/openai/gym/wiki/Pendulum-v1

在你的例子中,假设 Pendulum-v0 共享 v1 的特征,你的三个值意味着:

  • cos(theta),介于 -1 和 1 之间
  • sin(theta),介于 -1 和 1 之间
  • theta 点,或 angular 速度,介于 -8 和 8 之间

最佳