如何将 drake 的优化工具箱与 mujoco-py 模拟器结合起来?
How to incorporate drake's optimization toolboxes with mujoco-py simulator?
问题如下:假设用输入参数A和B进行单个MuJoCo仿真,仿真输出单个输出值V。MuJoCo得到A和B的"float"值,运行模拟然后输出 V.
优化的目标是通过调整 2 个输入参数 A 和 B 来最小化值 V。
我们如何将 pydrake 的优化代码(例如 prog = MathematicalProgram())与 MuJoCo 模拟相结合?
对于这种情况,输出值V不能直接用参数A和B写入,因为
MuJoCo 是一种外部 "black-box"。此外,由于 MuJoCo 是一种 "black-box",无法提供输出 V 的梯度信息。
对此有什么解决方法吗?
任何小 helps/comments 将不胜感激。
如果你没有渐变,那么我建议使用黑盒优化器。一种选择是 nevergrad,它包含各种黑盒优化器。请注意,您不需要使用 drake 的 MathematicalProgram 来调用 nevergrad。您只需要编写一个接受 A 和 B 的函数,然后使用 MuJoCo 计算输出。
问题如下:假设用输入参数A和B进行单个MuJoCo仿真,仿真输出单个输出值V。MuJoCo得到A和B的"float"值,运行模拟然后输出 V.
优化的目标是通过调整 2 个输入参数 A 和 B 来最小化值 V。
我们如何将 pydrake 的优化代码(例如 prog = MathematicalProgram())与 MuJoCo 模拟相结合?
对于这种情况,输出值V不能直接用参数A和B写入,因为 MuJoCo 是一种外部 "black-box"。此外,由于 MuJoCo 是一种 "black-box",无法提供输出 V 的梯度信息。
对此有什么解决方法吗?
任何小 helps/comments 将不胜感激。
如果你没有渐变,那么我建议使用黑盒优化器。一种选择是 nevergrad,它包含各种黑盒优化器。请注意,您不需要使用 drake 的 MathematicalProgram 来调用 nevergrad。您只需要编写一个接受 A 和 B 的函数,然后使用 MuJoCo 计算输出。