为什么对不同的机器学习算法采用不止一种评估方法很重要?

Why is it important to have more than one evaluation method for different machine learning algorithms?

找不到准确简洁的答案。我对不同的机器学习评估方法不是特别感兴趣,我只是想知道为什么拥有不止一种很重要?

每个指标都提供不同的见解,并以不同的方式评估您的模型。 举个二元分类的例子:

  • 准确性告诉您有多少百分比的预测是正确的。但是,如果您还想知道到底有多少个 1 出错了怎么办 [即你预测 0 应该是 1]。为此,您将计算召回分数。

所以你明白了,也许你想要好的准确率和好的召回率[现实世界的例子:也许垃圾邮件检测],所以你看看这两个指标并明智地选择