Google 云机器学习引擎 "Skipping evaluation due to same checkpoint"

Google Cloud ML Engine "Skipping evaluation due to same checkpoint"

所以我有一个基于 census tutorial 的 ML 引擎包,我尝试使用 --min-eval-frequency 标志每 N 步执行一次评估,但我一直在 stackdriver 中收到消息日志说:"Skipping evaluation due to same checkpoint..."。基本上,评估每个时期只会发生 1 次(因为我猜检查点最终会在那个时候发生变化)。是否需要一些额外的更改来更频繁地更新检查点?知道为什么这会更频繁地评估吗?

检查点以一定的频率发生。如果在计划进行新评估时尚未出现新检查点,您将收到消息 "Skipping evaluation due to same checkpoint..."。这是因为评估需要在单独的 tf.Session 中处理冻结的权重,以避免在评估期间权重发生变化,并且在会话之间传递这些权重的唯一方法是使用检查点。因此,如果您想更频繁地进行评估并且收到了该消息,请增加您的检查点频率。您可以通过添加填充 tf.contrib.learn.RunConfig#save_checkpoints_steps.

的标志来执行此操作