Google 云机器学习引擎 "Skipping evaluation due to same checkpoint"

Google Cloud ML Engine "Skipping evaluation due to same checkpoint"

所以我有一个基于 census tutorial 的 ML 引擎包，我尝试使用 --min-eval-frequency 标志每 N 步执行一次评估，但我一直在 stackdriver 中收到消息日志说："Skipping evaluation due to same checkpoint..."。基本上，评估每个时期只会发生 1 次（因为我猜检查点最终会在那个时候发生变化）。是否需要一些额外的更改来更频繁地更新检查点？知道为什么这会更频繁地评估吗？

检查点以一定的频率发生。如果在计划进行新评估时尚未出现新检查点，您将收到消息 "Skipping evaluation due to same checkpoint..."。这是因为评估需要在单独的 tf.Session 中处理冻结的权重，以避免在评估期间权重发生变化，并且在会话之间传递这些权重的唯一方法是使用检查点。因此，如果您想更频繁地进行评估并且收到了该消息，请增加您的检查点频率。您可以通过添加填充 tf.contrib.learn.RunConfig#save_checkpoints_steps.

的标志来执行此操作

Google 云机器学习引擎 "Skipping evaluation due to same checkpoint"

Google Cloud ML Engine "Skipping evaluation due to same checkpoint"

python

google-cloud-platform

tensorflow

google-cloud-ml

google-cloud-ml-engine