L1 范数与 l2 范数作为标准化时的成本函数
L1-norm vs l2-norm as cost function when standardizing
我有一些数据,其中输入值和输出值都是标准化的,所以 Y 和 Y_pred 之间的差异总是很小。
我觉得 l2 范数比 l1 范数对模型的惩罚要少,因为对 0 到 1 之间的数字进行平方总是会得到一个较小的数字。
所以我的问题是,当输入和输出都标准化时,使用 l2-norm 可以吗?
没关系
基本的idea/motivation是如何惩罚偏差。 L1-范数不太关心异常值,而 L2-范数会严重惩罚这些异常值。这是基本的区别,你会发现很多优点和缺点,即使在维基百科上也是如此。
所以关于你的问题,当预期偏差很小时它是否有意义:当然,它的行为是一样的。
举个例子:
y_real 1.0 ||| y_pred 0.8 ||| y_pred 0.6
l1: |0.2| = 0.2 |0.4| = 0.4 => 2x times more error!
l2: 0.2^2 = 0.04 0.4^2 = 0.16 => 4x times more error!
你看,基本思路还是适用的!
我有一些数据,其中输入值和输出值都是标准化的,所以 Y 和 Y_pred 之间的差异总是很小。
我觉得 l2 范数比 l1 范数对模型的惩罚要少,因为对 0 到 1 之间的数字进行平方总是会得到一个较小的数字。
所以我的问题是,当输入和输出都标准化时,使用 l2-norm 可以吗?
没关系
基本的idea/motivation是如何惩罚偏差。 L1-范数不太关心异常值,而 L2-范数会严重惩罚这些异常值。这是基本的区别,你会发现很多优点和缺点,即使在维基百科上也是如此。
所以关于你的问题,当预期偏差很小时它是否有意义:当然,它的行为是一样的。
举个例子:
y_real 1.0 ||| y_pred 0.8 ||| y_pred 0.6
l1: |0.2| = 0.2 |0.4| = 0.4 => 2x times more error!
l2: 0.2^2 = 0.04 0.4^2 = 0.16 => 4x times more error!
你看,基本思路还是适用的!