L1 范数与 l2 范数作为标准化时的成本函数

L1-norm vs l2-norm as cost function when standardizing

我有一些数据,其中输入值和输出值都是标准化的,所以 Y 和 Y_pred 之间的差异总是很小。

我觉得 l2 范数比 l1 范数对模型的惩罚要少,因为对 0 到 1 之间的数字进行平方总是会得到一个较小的数字。

所以我的问题是,当输入和输出都标准化时,使用 l2-norm 可以吗?

没关系

基本的idea/motivation是如何惩罚偏差。 L1-范数不太关心异常值,而 L2-范数会严重惩罚这些异常值。这是基本的区别,你会发现很多优点和缺点,即使在维基百科上也是如此。

所以关于你的问题,当预期偏差很小时它是否有意义:当然,它的行为是一样的。

举个例子:

y_real 1.0      ||| y_pred 0.8     ||| y_pred 0.6 
l1:                |0.2| = 0.2         |0.4| = 0.4  => 2x times more error!
l2:                0.2^2 = 0.04        0.4^2 = 0.16 => 4x times more error!

你看,基本思路还是适用的!