Keras LSTM 批量训练

Batch training in Keras LSTM

如果我在用 Keras 制作的 LSTM 中使用 32 的 batch_size,损失函数是应用于每个序列然后求平均,还是直接应用于所有不考虑每个序列的序列?

提前致谢。

因为一个 batch_size 意味着在一个序列之后更新权重,32 的批量大小意味着在这 32 个序列之后更新权重。

所以权重仅在这 32 个序列块之后更新,损失是所有这些序列的平均值,否则如果损失将更新到每个序列本身,它实际上代表普通 SGD batch_size = 1.