使用 tf.Dataset 训练的模型进行推理

Inference with a model trained with tf.Dataset

我已经使用 tf.data.Dataset API 训练了一个模型,所以我的训练代码看起来像这样

with graph.as_default():
    dataset = tf.data.TFRecordDataset(tfrecord_path)
    dataset = dataset.map(scale_features, num_parallel_calls=n_workers)
    dataset = dataset.shuffle(10000)
    dataset = dataset.padded_batch(batch_size, padded_shapes={...})
    handle = tf.placeholder(tf.string, shape=[])
    iterator = tf.data.Iterator.from_string_handle(handle,
                                                   train_dataset.output_types,
                                                   train_dataset.output_shapes)
    batch = iterator.get_next()
    ... 
    # Model code
    ...
    iterator = dataset.make_initializable_iterator()

with tf.Session(graph=graph) as sess:
    train_handle = sess.run(iterator.string_handle())
    sess.run(tf.global_variables_initializer())
    for epoch in range(n_epochs):
        sess.run(train_iterator.initializer)
        while True:
            try:
                sess.run(optimizer, feed_dict={handle: train_handle})
            except tf.errors.OutOfRangeError:
               break

模型训练完成后,我想推断数据集中没有的示例,但我不确定如何去做。

明确一点,我知道如何使用另一个数据集,例如,我只是在测试时将句柄传递给我的测试集。

问题是关于给定缩放方案和网络需要句柄的事实,如果我想对未写入 TFRecord 的新示例进行预测,我将如何去做?

如果我修改 batch 我会事先负责缩放,这是我想尽可能避免的事情。

那么我应该如何从模型中推断单个示例以 tf.data.Dataset 方式进行训练? (这不是出于生产目的,而是为了评估如果我更改特定功能会发生什么)

实际上在图中有一个名为"IteratorGetNext:0"的张量名称 当你使用数据集api时,你可以使用下面的方式直接设置 输入:

#get a tensor from a graph 
input tensor : input = graph.get_tensor_by_name("IteratorGetNext:0")
# difine the target tensor you want evaluate for your prediction
prediction tensor: predictions=...
# finally call session to run 
then sess.run(predictions, feed_dict={input: np.asanyarray(images), ...})