使用 Sutskever 技术通过反向传播计算导数

Calculating derivatives with backpropagation using Sutskever's technique

在 Ilya Sutskever 的 "TRAINING RECURRENT NEURAL NETWORK" 中,有以下技术用于在前馈神经网络中使用反向传播计算导数。

该网络有 l 个隐藏层、l+1 个权重矩阵和 b+1 个偏置向量。

"Forward"阶段:

"Backwards"阶段:

l+1不是索引有问题吗?例如,在前向阶段我们计算 z_l+1 但 return z_l.

(因为这是一篇如此重要的论文,我想我遗漏了一些东西)

没问题,有的索引是从0开始的(比如变量z),有的是从1开始的(比如变量x)。更仔细地遵循算法,试着用手写出来,比如 l=4。