r 上的 H2o 随机森林图

H2o random forest plot on r

我是 h2o 的新手,我在 r 上使用这个包有困难。 我正在使用 t运行ing 和测试集 5100 和 2300 obs 分别具有 18917 个变量和一个二进制目标 (0,1) 我运行一个运行dom森林:

train_h20<-as.h2o(train)
test_h20<-as.h2o(test)

forest <- h2o.randomForest(x = Words,
                           y = 18918,
                           training_frame = train_h20,
                           ntree = 250,
                           validation = test_h20,
                           seed = 8675309)

我知道我可以得到 logloss 或 mse 或 ... 随着树数的变化 但是有没有办法绘制模型本身的图像。我的意思是用于最终预测的最终集成树?

另外,另一个问题,在 randomForest 包中,我可以使用 varImp 函数返回我,以及绝对重要性,class-特定度量(计算为平均值准确性下降),我解释为 class 变量重要性的相对度量。

varImp 矩阵,运行domForest 包:

h2o 包中我只找到绝对重要性度量,有类似的东西吗?

在带有 randomForest 包的 R 中,随机森林的末端没有最终树。为了进行最终预测,随机森林使用投票方法。投票意味着,对于任何数据: 例如 0;

预测数据为 Class 0/森林中树木总数的树的

对于Class 1,它与Class 0相同;

预测数据为 Class 1/森林中树木总数的树的

但是你可以使用ctree。 图书馆("party") x <- ctree(Class ~ ., 数据=数据) 情节(x)