TensorFlow LSTM 生成模型

TensorFlow LSTM Generative Model

我正在学习 LSTM 语言模型教程 discussed here

对于语言模型,通常使用模型在训练后从头开始生成一个新句子(即来自模型的样本)。

我是 TensorFlow 的新手,但我正在尝试使用经过训练的模型生成新词,直到句子结束标记。

我的初步尝试:

x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
    state = session.run(m.final_state,
                               {m.input_data: x,
                                m.initial_state: state})
    x = state

失败并出现错误:

ValueError: setting an array element with a sequence.

这里的问题似乎是 feed_dict 中的 m.input_data: x 映射已通过 session.run()。在这种情况下,TensorFlow 期望 x 是一个 numpy 数组(或一些可以隐式转换为 numpy 数组的对象),但该值是一个 TensorFlow Tensor([=16= 的结果) ]).

幸运的是,解决方法很简单。将 x = tf.zeros_like(m.input_data) 替换为以下内容:

x = tf.zeros_like(m.input_data).eval()

...这确保 x 转换为 numpy 数组。

(请注意,实现此目的的更直接方法是将初始 x 构建为适当大小的 numpy 数组。)