RL 环境 - OpenAI Gym Taxi-v2 与 Taxi-v3

RL Environment - OpenAI Gym Taxi-v2 vs Taxi-v3

Gym Taxi-v2 已弃用。我的 Q-learning 实现仍然适用于 Taxi-v3，但出于某种原因，env.render() 在每一步都显示错误的出租车位置。

总之，除了多了一堵墙，Taxi-v2 和 Taxi-v3 有什么区别？

描述和地图中有小的更正，您可以查看pull request in github了解详情。