cs231n 卷积神经网络
cs231n Convoluted Neural networls
我在看斯坦福CS 231n的在线讲座。我有一个问题,也许我出于某种原因感到困惑。 link 是:
the video
转到35:46,在后向函数中,dx的公式为:
dx = self.y * dz.
我从
开始就没明白
z = x*y.
所以
dx = dz/y
有人可以解释一下为什么会出现这种差异吗?
这只是他的代码中的一个奇怪符号(dz,dx,dy 没有按通常的意义使用)。这里的变量 dz 表示成本函数 L(完整神经网络的)关于 z[= 的导数25=],而 L 关于 x 和 y 的导数记为 dx和dy。z关于x的导数,即 y,简单地由 self.y 给出。考虑到这些符号,其余的遵循链式法则。
我在看斯坦福CS 231n的在线讲座。我有一个问题,也许我出于某种原因感到困惑。 link 是: the video
转到35:46,在后向函数中,dx的公式为:
dx = self.y * dz.
我从
开始就没明白z = x*y.
所以
dx = dz/y
有人可以解释一下为什么会出现这种差异吗?
这只是他的代码中的一个奇怪符号(dz,dx,dy 没有按通常的意义使用)。这里的变量 dz 表示成本函数 L(完整神经网络的)关于 z[= 的导数25=],而 L 关于 x 和 y 的导数记为 dx和dy。z关于x的导数,即 y,简单地由 self.y 给出。考虑到这些符号,其余的遵循链式法则。