cs231n 卷积神经网络

cs231n Convoluted Neural networls

我在看斯坦福CS 231n的在线讲座。我有一个问题,也许我出于某种原因感到困惑。 link 是: the video

转到35:46,在后向函数中,dx的公式为:

dx = self.y * dz. 

我从

开始就没明白
z = x*y. 

所以

dx = dz/y

有人可以解释一下为什么会出现这种差异吗?

这只是他的代码中的一个奇怪符号(dz,dx,dy 没有按通常的意义使用)。这里的变量 dz 表示成本函数 L(完整神经网络的)关于 z[= 的导数25=],而 L 关于 xy 的导数记为 dxdyz关于x的导数,即 y,简单地由 self.y 给出。考虑到这些符号,其余的遵循链式法则。