多 class 模型的准确度、精确度和召回率

Question

如何计算每个 accuracy、precision 和 recall class 来自混淆矩阵？我正在使用嵌入式数据集 iris；混淆矩阵如下：

prediction   setosa versicolor virginica
setosa         29          0         0
versicolor      0         20         2
virginica       0          3        21

我使用 75 个条目作为训练集，其他条目用于测试：

iris.train <- c(sample(1:150, 75)) # have selected 75 randomly

Answer 1

在整个回答中，mat 是您描述的混淆矩阵。

您可以使用以下方法计算和存储准确度：

(accuracy <- sum(diag(mat)) / sum(mat))
# [1] 0.9333333

每个 class 的精度（假设预测在行上，真实结果在列上）可以用以下方法计算：

(precision <- diag(mat) / rowSums(mat))
#     setosa versicolor  virginica 
#  1.0000000  0.9090909  0.8750000

如果您想获取特定 class 的精度，您可以这样做：

(precision.versicolor <- precision["versicolor"])
# versicolor 
#  0.9090909

每个 class 的召回率（再次假设预测在行上，真实结果在列上）可以用以下方法计算：

recall <- (diag(mat) / colSums(mat))
#     setosa versicolor  virginica 
#  1.0000000  0.8695652  0.9130435

如果你想召回特定的 class，你可以这样做：

(recall.virginica <- recall["virginica"])
# virginica 
# 0.9130435

如果您将真实结果作为行，将预测结果作为列，那么您将翻转精度和召回率定义。

数据：

(mat = as.matrix(read.table(text="  setosa versicolor virginica
 setosa         29          0         0
 versicolor      0         20         2
 virginica       0          3        21", header=T)))
#            setosa versicolor virginica
# setosa         29          0         0
# versicolor      0         20         2
# virginica       0          3        21

多 class 模型的准确度、精确度和召回率

Accuracy, precision, and recall for multi-class model

r

machine-learning

confusion-matrix

precision-recall