逻辑回归中的负对数似然维度

Negative-log-likelihood dimensions in logistic regression

(有更好的markdown输入方式吗?)

我开始尝试学习正则化多 class 逻辑回归 class 运算符的工作原理,但我被困在第一步中。 $m$ classes 的逻辑回归的负对数似然函数及其梯度由下式给出:

如果我有一个大小为800K x 50的特征矩阵$\bf X$,$\bf W$, $\bf w_{k}$, $\bf x_{ 的维度是多少j}$,$n$ 和 $m$ 等于什么?


我以为$m=50$,$n=800K$,$\bf w$也是一个800K x 50矩阵,$\bf w_{k}$是$\bf的一列大小为800K x 1的W$,$\bf x_{j}$是一行大小为50 x 1的$\bf X$。但是显然我错了,因为如果这些向量的长度不相等,我就无法计算点积 $\bf w_{k}^{T} \bf x_{j}$ 。我误解了哪一部分?

您有 n=500k 个样本,每个样本由 50 个特征表示。所以,特征的数量是50。类,m的数量在你的问题中没有提到(它不是50)。 $\bf W$是权重矩阵,可以看做是一个50 x m矩阵。 $\bf w_{k}$ 是 $\bf W$ 的一列,它是一个大小为 50 x 1 的向量。关于 x 你是对的:$\bf x_{j}$ 是一行$\bf X$ 大小为 50 x 1.