应该使用哪个 OpenAI 健身房环境来解决最短路线问题?

Which OpenAI gym environment should be used for solve the shortest route problem?

我正在尝试使用强化学习来确定两个节点之间的最短路线。我不确定要使用什么环境。我找到了这个 particular environment,但不确定我的方向是否正确。任何人都可以帮忙。谁能推荐一些我可以使用的 python OpenAI 健身房环境。

我也在尝试做同样的事情。但目前,open-sourced 的 none OpenAI 健身房环境是适用的。所以我建议你创建自己的环境(这并不难)。这是我发现的:

  1. https://github.com/hubbs5/or-gym他们有多种组合优化的环境,但所有环境都有固定的格式。因此,如果您想使用自己的图表,这可能不合适。
  2. https://github.com/Velythyl/route-gym可以使用自己的网络图作为环境,并且可以对图进行加权。但是初始化图需要很长时间,因为他们试图找出所有可能的路径来构建奖励函数指标。所以在这个环境中无法使用大图。此外,此环境的 stablebaseline3 中的 check_env 会警告您 state/ observation_space 对于 step()reset() 无法正常工作。
  3. https://github.com/pmarszal/AIRouting 此环境适用于大多数简单图形。但是它没有考虑图中每条边的权重。
  4. https://core.ac.uk/download/pdf/334949709.pdf OpenGraphGym。它似乎是我们问题的理想解决方案,但我找不到它的 open-source 代码。
  5. https://github.com/dnoursi/gym-graph-search它只能给你随机生成的图,没有权重。
  6. https://github.com/dyllanwli/GraphRouteOptimizationRL/tree/master/src/gym_graph_map 这是我正在尝试做的事情:使用 real-world 地图提供商 Osmnx(以网络格式)生成一个环境,让代理找到具有自定义权重的最佳路线(还没完)

我也在尝试实现一个图形环境,特别是我想使用 RLLib + Pytorch Geometric 来学习图形上的一般问题。 到目前为止,我发现与@Dylan 在他们的回答中提到的完全相同的回购协议,但我还在 https://github.com/NJannasch/OpenGraphGym.

找到了 OpenGraphGym 的一个分支(已被作者删除)