如果 f(w) = log(sigmoid(w^T*x)) 计算 f(w) 的梯度 (d/dw)
If f(w) = log(sigmoid(w^T*x)) calculate the gradient (d/dw) of f(w)
w 是一个 (nx1) 向量,X 是一个 (nxn) 矩阵。这是我的工作:
但是这个网站 (http://www.matrixcalculus.org/) says that the derivative should be
我做错了什么?
解法其实是一样的,如果你把我的(第一个)解法用公分母展开,你就会得到第二个解法。
w 是一个 (nx1) 向量,X 是一个 (nxn) 矩阵。这是我的工作:
但是这个网站 (http://www.matrixcalculus.org/) says that the derivative should be
我做错了什么?
解法其实是一样的,如果你把我的(第一个)解法用公分母展开,你就会得到第二个解法。