RL 环境 - OpenAI Gym Taxi-v2 与 Taxi-v3

RL Environment - OpenAI Gym Taxi-v2 vs Taxi-v3

Gym Taxi-v2 已弃用。我的 Q-learning 实现仍然适用于 Taxi-v3,但出于某种原因,env.render() 在每一步都显示错误的出租车位置。

总之,除了多了一堵墙,Taxi-v2 和 Taxi-v3 有什么区别?

描述和地图中有小的更正,您可以查看pull request in github了解详情。