如何评估在 rllib (Ray) 的自定义环境中训练的演员?

How to evaluate actors trained in custom environments in rllib (Ray)?

按照 SimpleCorridor 示例,我可以创建自己的环境并训练模型!好的。但是当我尝试评估这个经过训练的模型时,rllib 无法识别我的自定义环境。

如何在自定义环境中评估经过训练的模型?

当我按照建议的 here 使用 rllib rollout ... 时,它无法识别我的环境,因为它是自定义环境。我希望有一个像 run_experiments 但像 evaluate_experiment 这样的函数,这样我就可以在我的一个文件中的项目中调用它。

这就是问题所在。 如果你想看我的custon_env就是这个one

现在我必须复制我的环境并将其粘贴到 gym/envs/ 包目录中并在 __init__.py 文件中注册它。

很高兴看到另一种方法来做到这一点

谢谢

您可以复制 rollout.py 脚本并修改它以在脚本开头注册任何自定义环境或模型。这将允许它与任何不在健身房的环境一起工作。