TensorFlow LSTM 生成模型
TensorFlow LSTM Generative Model
我正在学习 LSTM 语言模型教程 discussed here。
对于语言模型,通常使用模型在训练后从头开始生成一个新句子(即来自模型的样本)。
我是 TensorFlow 的新手,但我正在尝试使用经过训练的模型生成新词,直到句子结束标记。
我的初步尝试:
x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
state = session.run(m.final_state,
{m.input_data: x,
m.initial_state: state})
x = state
失败并出现错误:
ValueError: setting an array element with a sequence.
这里的问题似乎是 feed_dict
中的 m.input_data: x
映射已通过 session.run()
。在这种情况下,TensorFlow 期望 x
是一个 numpy 数组(或一些可以隐式转换为 numpy 数组的对象),但该值是一个 TensorFlow Tensor
([=16= 的结果) ]).
幸运的是,解决方法很简单。将 x = tf.zeros_like(m.input_data)
替换为以下内容:
x = tf.zeros_like(m.input_data).eval()
...这确保 x
转换为 numpy 数组。
(请注意,实现此目的的更直接方法是将初始 x
构建为适当大小的 numpy 数组。)
我正在学习 LSTM 语言模型教程 discussed here。
对于语言模型,通常使用模型在训练后从头开始生成一个新句子(即来自模型的样本)。
我是 TensorFlow 的新手,但我正在尝试使用经过训练的模型生成新词,直到句子结束标记。
我的初步尝试:
x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
state = session.run(m.final_state,
{m.input_data: x,
m.initial_state: state})
x = state
失败并出现错误:
ValueError: setting an array element with a sequence.
这里的问题似乎是 feed_dict
中的 m.input_data: x
映射已通过 session.run()
。在这种情况下,TensorFlow 期望 x
是一个 numpy 数组(或一些可以隐式转换为 numpy 数组的对象),但该值是一个 TensorFlow Tensor
([=16= 的结果) ]).
幸运的是,解决方法很简单。将 x = tf.zeros_like(m.input_data)
替换为以下内容:
x = tf.zeros_like(m.input_data).eval()
...这确保 x
转换为 numpy 数组。
(请注意,实现此目的的更直接方法是将初始 x
构建为适当大小的 numpy 数组。)