如何在训练和验证数据集之间切换模型迭代器？

Question

我正在学习 TensorFlow "lower API"，您可以在其中使用 tf.layers 手动指定层、创建数据集和迭代器，以及运行用于训练和验证模型的循环。我正在尝试运行培训和验证。不幸的是，我运行在尝试在训练和验证数据集之间切换时遇到错误：

这是我的：

self.train_it = \
    train_dataset.batch(self.batch_size).make_initializable_iterator()
self.validate_it = \
    train_dataset.batch(self.batch_size).make_initializable_iterator()

...

input_layer = self.train_it.get_next()[0]
hidden1 = tf.layers.dense(
    input_layer,
    ... )

...

with tf.name_scope('train'):
  self.train_op = \
        tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(self.loss)

...

for epo in range(epochs):
  # Train using self.train_it iterator.
  self.sess.run(self.train_it.initializer)
  total_loss = 0
  for iteration in range(n_batches):
    summary, _, batch_loss = self.sess.run([self.merged_summary, \
        self.train_op, self.loss])
    total_loss += batch_loss
  print('   Epoch : {}/{}, Training loss = {:.4f}'. \
            format(epo+1, epochs, total_loss / n_batches))
  # Validate using self.valid_it iterator.
  self.sess.run(self.validate_it.initializer)
  # HOW DO I TELL THE MODEL TO USE self.valid_it INSTEAD OF self.train_it ???

这里的问题是，一开始我已经告诉模型使用 train_it : input_layer = self.train_it.get_next()[0] ，现在我必须告诉它在 train_it 和 [= 之间切换15=] 每个时代。我一定在 API 中遗漏了一些关于如何做到这一点的内容。

Answer 1

我会使用可重新初始化的迭代器并执行以下操作。

train_dataset = train_dataset.batch(batch_size_train)
val_dataset = validation_dataset.batch(batch_size_val)

iterator = tf.data.Iterator.from_structure(train_dataset.output_types, train_dataset.output_shapes)

train_init_op = iterator.make_initializer(train_dataset)
val_init_op = iterator.make_initializer(val_dataset)

data, labels = iterator.get_next()

然后 link 模型中的数据和标签。之后在训练时执行以下操作：

for e in range(epochs):
    sess.run(train_init_op)
    for iteration in range(n_batches_val):
        ....
    sess.run(val_init_op)
    for iteration in range(n_batches_val):
        ....

如果您发现任何令人困惑的地方，请告诉我。

如何在训练和验证数据集之间切换模型迭代器？

How to switch model iterator between train and validate datasets?

iterator

tensorflow

tensorflow-datasets