计算预测连续值的准确度分数

Question

from sklearn.metrics import accuracy_score
accuracy_score(y_true, y_pred)

我相信这段代码会 return 我们预测的准确性。但是，我正在比较连续值的预测值和实际值，我相信它们中的大多数不会完全相同。

我是否应该拟合测试集值并绘制预测值以获得 R 平方？

谁能告诉我在连续变量的情况下如何衡量预测的准确性？

Answer 1

在机器学习中，准确度是针对离散值 (类) 定义的。它被定义为做出的总预测中正确预测的分数。

因此，预测值 319 而真实值为 320 仍然是不正确的预测。

因此不建议计算连续值的精度。对于此类值，您可能希望计算预测值与真实值的接近程度。这种预测连续值的任务称为回归。而且一般用R-squared值来衡量模型的性能。

您可以根据自己的情况使用 r2_score(y_true, y_pred)。

回归任务（连续变量预测）有多种指标，例如：-

您可以获得有关这些指标的 sklearn 实现的更多信息 here。

Calculating accuracy scores of predicted continuous values