Matlab 岭回归维度
Matlab Ridge Regression Dimensions
谁能解释一下 Matlab 岭回归函数中的比例因子?我发现了一个与用于缩放值的公式相关的 post,但我不确定为什么我不太确定它是如何工作的。当我将它设置为 0 时,我得到了典型的数字,但被迫输入没有 1s 列的 X 矩阵用于截距。如果我包含一列,则返回的 b 矩阵的行太多,无法相乘。另一方面,当我将比例因子设置为 1 时,我得到了完全不合理的值。有人可以解释发生了什么以及我该如何解决它吗?
b = ridge(Y,X,lambda,0);
size(Y) =
444205 1
size(X) =
444205 4
size(b) =
5 1
ridge()
自动居中和缩放 X
(对于每个特征,减去均值,除以标准差),并居中 y
。令 Xs
表示 X
的 centered/scaled 版本,ys
表示 y
的居中版本, b
表示 [= 返回的权重10=].
当scaled
标志设置为1时,b
给出从Xs
预测ys
的权重; ys
的预测值由 Xs * b
给出。不需要常数项,因为 Xs
和 ys
居中。
当scaled
标志设置为0时,b
给出从X
预测y
的权重。 b
的第一个元素包含一个常数项(这是必需的,因为 X
和 y
具有非零均值)。 y
的预测值由X * b(2:end) + b(1)
.
给出
中提供了有关此行为的更多信息
谁能解释一下 Matlab 岭回归函数中的比例因子?我发现了一个与用于缩放值的公式相关的 post,但我不确定为什么我不太确定它是如何工作的。当我将它设置为 0 时,我得到了典型的数字,但被迫输入没有 1s 列的 X 矩阵用于截距。如果我包含一列,则返回的 b 矩阵的行太多,无法相乘。另一方面,当我将比例因子设置为 1 时,我得到了完全不合理的值。有人可以解释发生了什么以及我该如何解决它吗?
b = ridge(Y,X,lambda,0);
size(Y) =
444205 1
size(X) =
444205 4
size(b) =
5 1
ridge()
自动居中和缩放 X
(对于每个特征,减去均值,除以标准差),并居中 y
。令 Xs
表示 X
的 centered/scaled 版本,ys
表示 y
的居中版本, b
表示 [= 返回的权重10=].
当scaled
标志设置为1时,b
给出从Xs
预测ys
的权重; ys
的预测值由 Xs * b
给出。不需要常数项,因为 Xs
和 ys
居中。
当scaled
标志设置为0时,b
给出从X
预测y
的权重。 b
的第一个元素包含一个常数项(这是必需的,因为 X
和 y
具有非零均值)。 y
的预测值由X * b(2:end) + b(1)
.