默认情况下,堆叠式 lstm 或堆叠式 RNN 是否需要跨层共享权重?

does stacked lstm or stacked RNN requires sharing the weights across layers as default?

在深度学习文献中,我遇到过很多使用堆叠 RNN ( 堆叠 LSTM ) 网络的例子,虽然探索了细胞本身的细节,但通常没有关于权重是否在不同层之间共享的信息堆叠架构与否。

我试图理解的是,当作者没有指定这一点时,默认行为是什么?我们是否应该假设他们已经跨层共享权重?或者每一层都有自己的一组权重?

假设每一层都有自己的一组权重。请参阅第 4 页的等式 (1) 和 (2) here。如您所见,权重取决于层(那里的方程式处理 vanilla rnn,但同样的假设也适用于 LSTM)。