如何解释 H2O 的混淆矩阵?
How to interpret H2O's confusion matrix?
我使用的是 h2o 版本 3.10.4.8。
library(magrittr)
library(h2o)
h2o.init(nthreads = -1, max_mem_size = "6g")
data.url <- "https://raw.githubusercontent.com/DarrenCook/h2o/bk/datasets/"
iris.hex <- paste0(data.url, "iris_wheader.csv") %>%
h2o.importFile(destination_frame = "iris.hex")
y <- "class"
x <- setdiff(names(iris.hex), y)
model.glm <- h2o.glm(x, y, iris.hex, family = "multinomial")
preds <- h2o.predict(model.glm, iris.hex)
h2o.confusionMatrix(model.glm)
h2o.table(preds["predict"])
这是h2o.confusionMatrix(model.glm)
的输出:
Confusion Matrix: vertical: actual; across: predicted
Iris-setosa Iris-versicolor Iris-virginica Error Rate
Iris-setosa 50 0 0 0.0000 = 0 / 50
Iris-versicolor 0 48 2 0.0400 = 2 / 50
Iris-virginica 0 1 49 0.0200 = 1 / 50
Totals 50 49 51 0.0200 = 3 / 150
既然它说 across:predicted,我将其解释为该模型做出了 50 (0 + 48 + 2) 次 Iris-versicolor 预测。
这是h2o.table(preds["predict"])
的输出:
predict Count
1 Iris-setosa 50
2 Iris-versicolor 49
3 Iris-virginica 51
这告诉我,该模型做出了 49 项 Iris-versicolor 的预测。
是混淆矩阵标记不正确还是我在解释结果时犯了错误?
行名称(垂直)是实际的标签。
列名(交叉)是预测的标签。
你没有看错;标签令人困惑(并导致人们认为行和列被切换)。这是 fixed recently,将包含在 H2O 的下一个版本中。
我使用的是 h2o 版本 3.10.4.8。
library(magrittr)
library(h2o)
h2o.init(nthreads = -1, max_mem_size = "6g")
data.url <- "https://raw.githubusercontent.com/DarrenCook/h2o/bk/datasets/"
iris.hex <- paste0(data.url, "iris_wheader.csv") %>%
h2o.importFile(destination_frame = "iris.hex")
y <- "class"
x <- setdiff(names(iris.hex), y)
model.glm <- h2o.glm(x, y, iris.hex, family = "multinomial")
preds <- h2o.predict(model.glm, iris.hex)
h2o.confusionMatrix(model.glm)
h2o.table(preds["predict"])
这是h2o.confusionMatrix(model.glm)
的输出:
Confusion Matrix: vertical: actual; across: predicted
Iris-setosa Iris-versicolor Iris-virginica Error Rate
Iris-setosa 50 0 0 0.0000 = 0 / 50
Iris-versicolor 0 48 2 0.0400 = 2 / 50
Iris-virginica 0 1 49 0.0200 = 1 / 50
Totals 50 49 51 0.0200 = 3 / 150
既然它说 across:predicted,我将其解释为该模型做出了 50 (0 + 48 + 2) 次 Iris-versicolor 预测。
这是h2o.table(preds["predict"])
的输出:
predict Count
1 Iris-setosa 50
2 Iris-versicolor 49
3 Iris-virginica 51
这告诉我,该模型做出了 49 项 Iris-versicolor 的预测。
是混淆矩阵标记不正确还是我在解释结果时犯了错误?
行名称(垂直)是实际的标签。
列名(交叉)是预测的标签。
你没有看错;标签令人困惑(并导致人们认为行和列被切换)。这是 fixed recently,将包含在 H2O 的下一个版本中。