在 TensorFlow 中保存和恢复函数

Saving and restoring functions in TensorFlow

我正在 TensorFlow 中开发一个 VAE 项目,其中 encoder/decoder 网络是内置函数。这个想法是能够保存,然后加载训练好的模型并使用编码器功能进行采样。

恢复模型后,我无法将解码器函数设置为 运行 并返回恢复后的训练变量,出现 "Uninitialized value" 错误。我认为这是因为该函数要么创建一个新函数,要么覆盖现有函数,要么以其他方式。但我不知道如何解决这个问题。这是一些代码:

class VAE(object):    
    def __init__(self, restore=True):
        self.session = tf.Session()
        if restore:
            self.restore_model()
            self.build_decoder = tf.make_template('decoder', self._build_decoder)

@staticmethod
def _build_decoder(z, output_size=768, hidden_size=200,
                  hidden_activation=tf.nn.elu, output_activation=tf.nn.sigmoid):
    x = tf.layers.dense(z, hidden_size, activation=hidden_activation)
    x = tf.layers.dense(x, hidden_size, activation=hidden_activation)
    logits = tf.layers.dense(x, output_size, activation=output_activation)
    return distributions.Independent(distributions.Bernoulli(logits), 2)

def sample_decoder(self, n_samples):
    prior = self.build_prior(self.latent_dim)
    samples = self.build_decoder(prior.sample(n_samples), self.input_size).mean()
    return self.session.run([samples])

def restore_model(self):
    print("Restoring")
    self.saver = tf.train.import_meta_graph(os.path.join(self.save_dir, "turbolearn.meta"))
    self.saver.restore(self.sess, tf.train.latest_checkpoint(self.save_dir))
    self._restored = True

想要运行samples = vae.sample_decoder(5)

在我的日常训练中,我 运行:

        if self.checkpoint:
            self.saver.save(self.session, os.path.join(self.save_dir, "myvae"), write_meta_graph=True)

更新

根据下面的建议答案,我更改了还原方法

self.saver = tf.train.Saver()
self.saver.restore(self.session, tf.train.latest_checkpoint(self.save_dir))

但现在在创建 Saver() 对象时出现值错误:

ValueError: No variables to save

tf.train.import_meta_graph恢复图形,即重建存储到文件中的网络架构。另一方面,对 tf.train.Saver.restore 的调用仅将文件中的变量值恢复到会话中的当前图形(如果文件中的某些值属于当前活动中不存在的变量,这自然会失败图)。

因此,如果您已经在代码中构建了网络层,则无需调用 tf.train.import_meta_graph。否则这可能会给您带来麻烦。

不确定其余代码的样子,但这里有一些建议。首先构建图形,然后创建会话,如果适用,最后恢复。你的 init 可能看起来像这样

def __init__(self, restore=True):
    self.build_decoder = tf.make_template('decoder', self._build_decoder)
    self.session = tf.Session()
    if restore:
        self.restore_model()

但是,如果您只是恢复编码器,并重新构建解码器,则可以最后构建解码器。但是不要忘记在使用前初始化它的变量。