应该使用哪个 OpenAI 健身房环境来解决最短路线问题？

Which OpenAI gym environment should be used for solve the shortest route problem?

我正在尝试使用强化学习来确定两个节点之间的最短路线。我不确定要使用什么环境。我找到了这个 particular environment，但不确定我的方向是否正确。任何人都可以帮忙。谁能推荐一些我可以使用的 python OpenAI 健身房环境。

我也在尝试做同样的事情。但目前，open-sourced 的 none OpenAI 健身房环境是适用的。所以我建议你创建自己的环境（这并不难）。这是我发现的：

https://github.com/hubbs5/or-gym他们有多种组合优化的环境，但所有环境都有固定的格式。因此，如果您想使用自己的图表，这可能不合适。
https://github.com/Velythyl/route-gym可以使用自己的网络图作为环境，并且可以对图进行加权。但是初始化图需要很长时间，因为他们试图找出所有可能的路径来构建奖励函数指标。所以在这个环境中无法使用大图。此外，此环境的 stablebaseline3 中的 check_env 会警告您 state/ observation_space 对于 step() 和 reset() 无法正常工作。
https://github.com/pmarszal/AIRouting 此环境适用于大多数简单图形。但是它没有考虑图中每条边的权重。
https://core.ac.uk/download/pdf/334949709.pdf OpenGraphGym。它似乎是我们问题的理想解决方案，但我找不到它的 open-source 代码。
https://github.com/dnoursi/gym-graph-search它只能给你随机生成的图，没有权重。
https://github.com/dyllanwli/GraphRouteOptimizationRL/tree/master/src/gym_graph_map 这是我正在尝试做的事情：使用 real-world 地图提供商 Osmnx（以网络格式）生成一个环境，让代理找到具有自定义权重的最佳路线（还没完）

我也在尝试实现一个图形环境，特别是我想使用 RLLib + Pytorch Geometric 来学习图形上的一般问题。到目前为止，我发现与@Dylan 在他们的回答中提到的完全相同的回购协议，但我还在 https://github.com/NJannasch/OpenGraphGym.

找到了 OpenGraphGym 的一个分支（已被作者删除）