计算预测连续值的准确度分数

Calculating accuracy scores of predicted continuous values

from sklearn.metrics import accuracy_score
accuracy_score(y_true, y_pred)

我相信这段代码会 return 我们预测的准确性。但是,我正在比较连续值的预测值和实际值,我相信它们中的大多数不会完全相同。

我是否应该拟合测试集值并绘制预测值以获得 R 平方?

谁能告诉我在连续变量的情况下如何衡量预测的准确性?

在机器学习中,准确度是针对离散值 (类) 定义的。它被定义为做出的总预测中正确预测的分数。

因此,预测值 319 而真实值为 320 仍然是不正确的预测。

因此不建议计算连续值的精度。对于此类值,您可能希望计算预测值与真实值的接近程度。这种预测连续值的任务称为回归。而且一般用R-squared值来衡量模型的性能。

您可以根据自己的情况使用 r2_score(y_true, y_pred)

回归任务(连续变量预测)有多种指标,例如:-

  • 均方误差,
  • 平均绝对误差,
  • 方差分数等

您可以获得有关这些指标的 sklearn 实现的更多信息 here