如何一进三出LSTM tensorflow

Question

我正在尝试学习 LSTM，但我有一个困惑，如果我有一个单词列表，例如：

vocabulary=['hello','how','are','you','tell','me','something','about','yourself']

现在我想提供一个输入：

ex :  input_data = ['hello']

我希望它能预测接下来的三个词：

ex :  output_data = ['how','are','you']

所以我想通过随机选择 4 个单词来训练 LSTM，然后将该单词列表分块为 1 作为输入，其余 3 作为输出。

让我们举一个简单的例子：

ex :  input_data = ['hello']


ex :  output_data = ['how','are','you']

将它们转换为一个热点后：

final_input=[]
for i in x_data:
    matrix = [0] * len(main_vocabulary)
    matrix[main_vocabulary.index(i)]=1
    final_input.append(matrix)


output=[main_vocabulary.index(i) for i in y_data]

print(final_input)

print(output)

:

[[1, 0, 0, 0, 0, 0, 0, 0, 0]]
[1, 2, 3]

现在我的困惑是如何将这种格式提供给 LSTM？

因为我读过 LSTM 输入和输出向量形状应该相同，是真的吗？

input_placeholder=tf.placeholder(tf.float32,[None,1,9])
output_placeholder=tf.placeholder(tf.int32,[None,3])

但我认为这不正确，请建议如何喂养。

rnn.BasicLSTMCell(num_units=?,state_is_tuple=True)

中 num_units 的数量是多少

我在想 num_units 应该与数据列相同，所以这里应该是 9 。

Answer 1

从概念上讲，最简单的方法是序列到序列 RNN。也应该可以使用普通的 RNN，尽管输入和输出的可变长度编程起来很麻烦（如果你想在将来更改它们）。

看看 http://karpathy.github.io/2015/05/21/rnn-effectiveness/（标准的 RNN 介绍博客 - 我相信你以前看过这个）并注意说明各种类型的 RNN 的图表。您需要 one-to-many 配置。

老实说，听起来您可能有点不知所措。我建议尝试通过研究 https://github.com/guillaume-chevalier/seq2seq-signal-prediction

来了解 RNN 的基础知识

如何一进三出LSTM tensorflow

How to One input and Three output LSTM tensorflow

python

lstm

keras

tensorflow

rnn