L1 范数与 l2 范数作为标准化时的成本函数

Question

我有一些数据，其中输入值和输出值都是标准化的，所以 Y 和 Y_pred 之间的差异总是很小。

我觉得 l2 范数比 l1 范数对模型的惩罚要少，因为对 0 到 1 之间的数字进行平方总是会得到一个较小的数字。

所以我的问题是，当输入和输出都标准化时，使用 l2-norm 可以吗？

Answer 1

没关系

基本的idea/motivation是如何惩罚偏差。 L1-范数不太关心异常值，而 L2-范数会严重惩罚这些异常值。这是基本的区别，你会发现很多优点和缺点，即使在维基百科上也是如此。

所以关于你的问题，当预期偏差很小时它是否有意义：当然，它的行为是一样的。

举个例子：

y_real 1.0      ||| y_pred 0.8     ||| y_pred 0.6 
l1:                |0.2| = 0.2         |0.4| = 0.4  => 2x times more error!
l2:                0.2^2 = 0.04        0.4^2 = 0.16 => 4x times more error!

你看，基本思路还是适用的！

L1 范数与 l2 范数作为标准化时的成本函数

L1-norm vs l2-norm as cost function when standardizing

statistics

machine-learning

gradient-descent