Matlab 岭回归维度

Matlab Ridge Regression Dimensions

谁能解释一下 Matlab 岭回归函数中的比例因子?我发现了一个与用于缩放值的公式相关的 post,但我不确定为什么我不太确定它是如何工作的。当我将它设置为 0 时,我得到了典型的数字,但被迫输入没有 1s 列的 X 矩阵用于截距。如果我包含一列,则返回的 b 矩阵的行太多,无法相乘。另一方面,当我将比例因子设置为 1 时,我得到了完全不合理的值。有人可以解释发生了什么以及我该如何解决它吗?

b = ridge(Y,X,lambda,0);
size(Y) = 
          444205     1
size(X) = 
          444205     4
size(b) = 
               5     1

ridge() 自动居中和缩放 X(对于每个特征,减去均值,除以标准差),并居中 y。令 Xs 表示 X 的 centered/scaled 版本,ys 表示 y 的居中版本, b 表示 [= 返回的权重10=].

scaled标志设置为1时,b给出从Xs预测ys的权重; ys 的预测值由 Xs * b 给出。不需要常数项,因为 Xsys 居中。

scaled标志设置为0时,b给出从X预测y的权重。 b 的第一个元素包含一个常数项(这是必需的,因为 Xy 具有非零均值)。 y的预测值由X * b(2:end) + b(1).

给出

documentation.

中提供了有关此行为的更多信息