转换为估算器时 LSTM InvalidArgumentError Tensorflow 2.0/Keras

Question

我正在尝试构建一个 LSTM 网络，该网络接收一系列单词并将其转换为嵌入向量。我已经将每个单词序列转换为词汇向量。

我使用的批量大小是 32，每个词汇向量的大小是 50。这是我目前使用的 Keras 函数 API 代码来创建模型并将其转换为估算器

input_layer = keras.layers.Input(shape=(50,), name='search')
embedding_layer = keras.layers.Embedding(input_dim=32, output_dim=256, input_length=50)(input_layer)
lstm_layer = keras.layers.LSTM(units=256)(embedding_layer)
model = keras.models.Model(inputs=input_layer, outputs=lstm_layer)
model.compile(loss='mean_squared_error', optimizer='adam')
estimator = keras.estimator.model_to_estimator(keras_model=model)

但是这段代码报错

tensorflow.python.framework.errors_impl.InvalidArgumentError: Node 'Adam/gradients/lstm/StatefulPartitionedCall_grad/StatefulPartitionedCall': Connecting to invalid output 5 of source node lstm/StatefulPartitionedCall which has 5 outputs

当我运行model.summary()时，这是输出

Layer (type)                 Output Shape              Param #   
=================================================================
search (InputLayer)          [(None, 50)]              0         
_________________________________________________________________
embedding (Embedding)        (None, 50, 256)           8192      
_________________________________________________________________
lstm (LSTM)                  (None, 256)               525312    
=================================================================
Total params: 533,504
Trainable params: 533,504
Non-trainable params: 0
_________________________________________________________________

我认为这是我所期望的。我尝试用相同形状的 Dense 和 Flatten 层替换 LSTM 层，代码工作正常

Answer 1

我要自己回答这个问题...从 7 月 24 日开始，tf.keras.layers.LSTM 似乎有问题 here。我把模型改成了下面的

input_layer = keras.layers.Input(shape=(50,), name='search')
embedding_layer = keras.layers.Embedding(input_dim=32, output_dim=256, 
input_length=50)(input_layer)
lstm_layer = keras.layers.RNN(cell=keras.layers.LSTMCell(units=256))(embedding_layer)
model = keras.models.Model(inputs=input_layer, outputs=lstm_layer)
model.compile(loss='mean_squared_error', optimizer='adam')
estimator = keras.estimator.model_to_estimator(keras_model=model)

转换为估算器时 LSTM InvalidArgumentError Tensorflow 2.0/Keras

LSTM InvalidArgumentError Tensorflow 2.0/Keras when converting to estimator

python

lstm

tensorflow

tensorflow-estimator