为什么负数(MSE 或 MAS)评分参数如 SKLEARN 中的 neg_mean_absolute_error 被认为用于回归模型评估

Why is negative (MSE or MAS) Scoring parameter like- neg_mean_absolute_error in SKLEARN is considered for regression model evaluation

我是机器学习的新手,在学习课程时遇到了 "Scoring Parameter"。我了解回归模型评估,我们考虑了均方误差、平均绝对误差等的负数

当我想知道原因时,我查看了 SKLearn 文档,上面写着 "All scorer objects follow the convention that higher return values are better than lower return values. Thus metrics which measure the distance between the model and the data, like metrics.mean_squared_error, are available as neg_mean_squared_error which return the negated value of the metric."

这个解释没有完全回答我的原因,我很困惑。那么,为什么负数更多,因为从逻辑上讲,如果预测的差异更高,无论是 -ve 还是 +ve,它都会使我们的模型同样糟糕。那为什么评分参数关注负差异呢?

很简单:最小化 MSE 等同于最大化负 MSE。

正如 Sklearn 文档所建议的那样,评分器可以最大化的 objective 函数只是 "convention"。

我认为您对neg_mean_absolute_error(NMAE)的理解方式存在细微的误解。 neg_mean_absolute_error的计算方式如下:

其中N是数据点总数,Y_i是真值,Y_i^p是预测值。

如果模型预测高于或低于真实值,我们仍然同样惩罚模型,但只是我们将最终结果乘以 -1 只是为了遵循 sklearn 的约定放。因此,如果一个模型为您提供 0.55 的 MAE,而另一个模型为您提供 0.78 的 MAE,则它们的 NMAE 值将翻转为 -0.55-0.78,并且按照越高越好的惯例,我们选择前一个模型,其结果 NMAE of -0.55.

你可以为 MSE 做一个类似的论证。