TensorFlow LSTM 生成模型

Question

我正在学习 LSTM 语言模型教程 discussed here。

对于语言模型，通常使用模型在训练后从头开始生成一个新句子（即来自模型的样本）。

我是 TensorFlow 的新手，但我正在尝试使用经过训练的模型生成新词，直到句子结束标记。

我的初步尝试：

x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
    state = session.run(m.final_state,
                               {m.input_data: x,
                                m.initial_state: state})
    x = state

失败并出现错误：

ValueError: setting an array element with a sequence.

Answer 1

这里的问题似乎是 feed_dict 中的 m.input_data: x 映射已通过 session.run()。在这种情况下，TensorFlow 期望 x 是一个 numpy 数组（或一些可以隐式转换为 numpy 数组的对象），但该值是一个 TensorFlow Tensor（[=16= 的结果） ]).

幸运的是，解决方法很简单。将 x = tf.zeros_like(m.input_data) 替换为以下内容：

x = tf.zeros_like(m.input_data).eval()

...这确保 x 转换为 numpy 数组。

（请注意，实现此目的的更直接方法是将初始 x 构建为适当大小的 numpy 数组。）

TensorFlow LSTM 生成模型

TensorFlow LSTM Generative Model

lstm

tensorflow