解释 model.fit 在 LSTM 编码器-解码器中使用 Keras /Tensorflow 的注意模型进行文本摘要

explain model.fit in LSTM encoder-decoder with Attention model for Text Summarization using Keras /Tensorflow

在使用 Keras 进行深度学习时,我经常遇到 model.fit 这样的事情:

model.fit(x_train, y_train, epochs=50, callbacks=[es], batch_size=512, validation_data=(x_val, y_val)

而在 NLP taks 中,我看过一些关于使用 LSTM 编码器-解码器和注意力模型进行文本摘要的文章,我通常会遇到这段代码来拟合我无法理解的模型:

model.fit([x_tr,y_tr[:,:-1]], y_tr.reshape(y_tr.shape[0],y_tr.shape[1], 1)[:,1:] ,epochs=50,callbacks=[es],batch_size=512, validation_data=([x_val,y_val[:,:-1]], y_val.reshape(y_val.shape[0],y_val.shape[1], 1)[:,1:]))

而且我没有找到任何解释为什么要这样做。有人可以对上面的代码进行解释。以上代码可在https://www.analyticsvidhya.com/blog/2019/06/comprehensive-guide-text-summarization-using-deep-learning-python/

找到

请注意:我已经联系了写这篇文章的人,但没有得到他的回应。

刚看到你的问题。无论如何,如果有人有类似的问题,这里是 explanation.

model.fit() 方法来拟合训练数据,您可以在其中定义批量大小,例如在你的情况下是 512。将文本和摘要(不包括摘要中的最后一个单词)作为输入,将包含每个单词(从第二个单词开始)的重塑摘要张量作为输出(这解释了将智能注入模型以预测单词,给定前一个词)。此外,要在训练阶段启用验证,还要发送验证数据。