OpenAI gym 的 breakout-v0 "pauses"

OpenAI gym's breakout-v0 "pauses"

在 OpenAI gym 环境中训练时,我觉得环境有时 "stops"。对于连续的许多帧,没有球 visible/stops 生成。

这是健身房环境的错误吗?这是 Breakout-v0 游戏的一部分吗?

我也想知道 Breakout-v0 中可能的操作是什么。我有点想通了:

0 - nothing/stand 还在吗?

1 - nothing/stand 还在吗?

2 - 向右应用 "force"?

3 - 向左侧应用 "force"?

编辑: 对于想知道我在说什么的人:请看这个 gif:http://imgur.com/a/pBLGX 5条命和4条命之间的转换需要很多帧...有时中断甚至比这还要长...

这是因为您的代理在生命周期结束后需要按下启动按钮才能让游戏重新开始运行。如果它不学习这样做,那么游戏将不会进行,并且看起来像你说的那样暂停。

我相信我脑海中的动作是:

0:无操作 1:火 2:对 3: 左边

方向可能不一样