训练 tf.estimator 时记录准确度指标

Log accuracy metric while training a tf.estimator

在训练预先设定的估计器时打印准确度指标以及损失的最简单方法是什么?

大多数教程和文档似乎都解决了创建自定义估算器时的问题——如果打算使用其中一个可用的估算器,这似乎有点过分了。

tf.contrib.learn 有一些(现已弃用)监视器挂钩。 TF 现在建议使用 hook API,但它似乎实际上并没有附带任何可以利用标签和预测来生成准确率数字的东西。

您尝试过tf.contrib.estimator.add_metrics(estimator, metric_fn)doc)吗?它需要一个初始化的估计器(可以预先封装)并向其添加 metric_fn.

定义的指标

用法示例:

def custom_metric(labels, predictions):
    # This function will be called by the Estimator, passing its predictions.
    # Let's suppose you want to add the "mean" metric...

    # Accessing the class predictions (careful, the key name may change from one canned Estimator to another)
    predicted_classes = predictions["class_ids"]  

    # Defining the metric (value and update tensors):
    custom_metric = tf.metrics.mean(labels, predicted_classes, name="custom_metric")

    # Returning as a dict:
    return {"custom_metric": custom_metric}

# Initializing your canned Estimator:
classifier = tf.estimator.DNNClassifier(feature_columns=columns_feat, hidden_units=[10, 10], n_classes=NUM_CLASSES)

# Adding your custom metrics:
classifier = tf.contrib.estimator.add_metrics(classifier, custom_metric)

# Training/Evaluating:
tf.logging.set_verbosity(tf.logging.INFO) # Just to have some logs to display for demonstration

train_spec = tf.estimator.TrainSpec(input_fn=lambda:your_train_dataset_function(),
                                    max_steps=TRAIN_STEPS)
eval_spec=tf.estimator.EvalSpec(input_fn=lambda:your_test_dataset_function(),
                                steps=EVAL_STEPS,
                                start_delay_secs=EVAL_DELAY,
                                throttle_secs=EVAL_INTERVAL)
tf.estimator.train_and_evaluate(classifier, train_spec, eval_spec)

日志:

...
INFO:tensorflow:Running local_init_op.
INFO:tensorflow:Done running local_init_op.
INFO:tensorflow:Evaluation [20/200]
INFO:tensorflow:Evaluation [40/200]
...
INFO:tensorflow:Evaluation [200/200]
INFO:tensorflow:Finished evaluation at 2018-04-19-09:23:03
INFO:tensorflow:Saving dict for global step 1: accuracy = 0.5668, average_loss = 0.951766, custom_metric = 1.2442, global_step = 1, loss = 95.1766
...

如您所见,custom_metric 与默认指标和损失一起返回。

除了@Aldream 的回答之外,您还可以使用 TensorBoard 查看 custom_metric 的一些图形。为此,请将其添加到 TensorFlow 摘要中,如下所示:

tf.summary.scalar('custom_metric', custom_metric)

当您使用 tf.estimator.Estimator 时最酷的事情是您不需要将摘要添加到 FileWriter,因为它是自动完成的(默认情况下每 100 步合并和保存它们).

要查看 TensorBoard,您需要打开一个新终端并输入:

tensorboard --logdir={$MODEL_DIR}

之后您将能够在 localhost:6006 的浏览器中看到图形。