计算预测连续值的准确度分数
Calculating accuracy scores of predicted continuous values
from sklearn.metrics import accuracy_score
accuracy_score(y_true, y_pred)
我相信这段代码会 return 我们预测的准确性。但是,我正在比较连续值的预测值和实际值,我相信它们中的大多数不会完全相同。
我是否应该拟合测试集值并绘制预测值以获得 R 平方?
谁能告诉我在连续变量的情况下如何衡量预测的准确性?
在机器学习中,准确度是针对离散值 (类) 定义的。它被定义为做出的总预测中正确预测的分数。
因此,预测值 319 而真实值为 320 仍然是不正确的预测。
因此不建议计算连续值的精度。对于此类值,您可能希望计算预测值与真实值的接近程度。这种预测连续值的任务称为回归。而且一般用R-squared值来衡量模型的性能。
您可以根据自己的情况使用 r2_score(y_true, y_pred)
。
回归任务(连续变量预测)有多种指标,例如:-
- 均方误差,
- 平均绝对误差,
- 方差分数等
您可以获得有关这些指标的 sklearn 实现的更多信息 here。
from sklearn.metrics import accuracy_score
accuracy_score(y_true, y_pred)
我相信这段代码会 return 我们预测的准确性。但是,我正在比较连续值的预测值和实际值,我相信它们中的大多数不会完全相同。
我是否应该拟合测试集值并绘制预测值以获得 R 平方?
谁能告诉我在连续变量的情况下如何衡量预测的准确性?
在机器学习中,准确度是针对离散值 (类) 定义的。它被定义为做出的总预测中正确预测的分数。
因此,预测值 319 而真实值为 320 仍然是不正确的预测。
因此不建议计算连续值的精度。对于此类值,您可能希望计算预测值与真实值的接近程度。这种预测连续值的任务称为回归。而且一般用R-squared值来衡量模型的性能。
您可以根据自己的情况使用 r2_score(y_true, y_pred)
。
回归任务(连续变量预测)有多种指标,例如:-
- 均方误差,
- 平均绝对误差,
- 方差分数等
您可以获得有关这些指标的 sklearn 实现的更多信息 here。