封闭形式的解决方案是否总是过度拟合？

Will closed form solution be always overfitting?

因为我们对某些机器学习问题（例如线性回归）有封闭形式的解决方案。它们具有更高的 O(D^3) 复杂度（D 是从输入派生的特征数），但是使用封闭形式派生的解决方案是否总是会过拟合？

我知道封闭形式的解决方案需要更长的计算能力，这对于大量特征可能不可行。
我也了解梯度下降、随机梯度下降等。生成足够接近且复杂度较低的解决方案。

只是想了解，使用封闭形式的解决方案是否有任何好处？

是：简而言之，您已找到该数据集的最佳解决方案。根据定义，总体样本的 closed-form 解将是该样本的 over-fitted。但是请注意，如果样本是整个总体，则您的解决方案必然是最优的。

各种 "sneak up on it" 解决方案（例如梯度下降）专门设计用于通过启发式方法在您指定的任意小误差范围内找到相同解决方案。这是数值分析的灵魂。 :-)

对于大多数用途，只有当您需要准确的精确解以进行进一步的理论推导时，closed-form 解才有用。在某些情况下，它的预测速度也更快（仅 forward-pass），因为它的权重要少得多。但是，预测通常受限于 I/O 速度，而不是模型复杂性。

这在一般情况下是不正确的，但在某些情况下实际上是正确的。

假设您有数百万个观察值和数千个特征，并且您将线性回归拟合到设计矩阵的第一主成分。这是封闭形式没有过拟合的第一种情况：N 远大于 P

或者，岭回归有一个封闭形式的解决方案。它R，就是solve(crossprod(X) + lambda * diag(rep(1, nrow(x))) %*% t(X) %*% y。交叉验证 select 最优 lambda 通常比梯度下降更快。这是第二种情况：闭式解涉及一个超参数。广义加性模型也有点像这样。

封闭形式的解决方案是否总是过度拟合？

Will closed form solution be always overfitting?

regression

machine-learning

linear-regression