在 MLflow 中继续停止 运行

Continue stopped run in MLflow

我们 运行 我们在 AWS 现货实例上的实验。有时实验会停止,我们更愿意继续记录到相同的 运行。如何设置活动 运行 的 运行-id?

像这样的伪代码(不工作):

if new:
    mlflow.start_run(experiment_id=1, run_name=x)
else:
    mlflow.set_run(run_id)

您可以将 run_id 直接传递给 start_run:

mlflow.start_run(experiment_id=1,
                 run_name=x,
                 run_id=<run_id_of_interrupted_run> # pass None to start a new run
                 ) 

当然,你必须为此存储run_id。你可以用run.info.run_id

得到它