r 上的 H2o 随机森林图
H2o random forest plot on r
我是 h2o
的新手,我在 r 上使用这个包有困难。
我正在使用 t运行ing 和测试集 5100 和 2300 obs 分别具有 18917 个变量和一个二进制目标 (0,1)
我运行一个运行dom森林:
train_h20<-as.h2o(train)
test_h20<-as.h2o(test)
forest <- h2o.randomForest(x = Words,
y = 18918,
training_frame = train_h20,
ntree = 250,
validation = test_h20,
seed = 8675309)
我知道我可以得到 logloss 或 mse 或 ... 随着树数的变化
但是有没有办法绘制模型本身的图像。我的意思是用于最终预测的最终集成树?
另外,另一个问题,在 randomForest
包中,我可以使用 varImp
函数返回我,以及绝对重要性,class-特定度量(计算为平均值准确性下降),我解释为 class 变量重要性的相对度量。
varImp 矩阵,运行domForest 包:
在 h2o
包中我只找到绝对重要性度量,有类似的东西吗?
在带有 randomForest 包的 R 中,随机森林的末端没有最终树。为了进行最终预测,随机森林使用投票方法。投票意味着,对于任何数据:
例如 0;
预测数据为 Class 0/森林中树木总数的树的
对于Class 1,它与Class 0相同;
预测数据为 Class 1/森林中树木总数的树的
但是你可以使用ctree。
图书馆("party")
x <- ctree(Class ~ ., 数据=数据)
情节(x)
我是 h2o
的新手,我在 r 上使用这个包有困难。
我正在使用 t运行ing 和测试集 5100 和 2300 obs 分别具有 18917 个变量和一个二进制目标 (0,1)
我运行一个运行dom森林:
train_h20<-as.h2o(train)
test_h20<-as.h2o(test)
forest <- h2o.randomForest(x = Words,
y = 18918,
training_frame = train_h20,
ntree = 250,
validation = test_h20,
seed = 8675309)
我知道我可以得到 logloss 或 mse 或 ... 随着树数的变化 但是有没有办法绘制模型本身的图像。我的意思是用于最终预测的最终集成树?
另外,另一个问题,在 randomForest
包中,我可以使用 varImp
函数返回我,以及绝对重要性,class-特定度量(计算为平均值准确性下降),我解释为 class 变量重要性的相对度量。
varImp 矩阵,运行domForest 包:
h2o
包中我只找到绝对重要性度量,有类似的东西吗?
在带有 randomForest 包的 R 中,随机森林的末端没有最终树。为了进行最终预测,随机森林使用投票方法。投票意味着,对于任何数据: 例如 0;
预测数据为 Class 0/森林中树木总数的树的
对于Class 1,它与Class 0相同;
预测数据为 Class 1/森林中树木总数的树的
但是你可以使用ctree。 图书馆("party") x <- ctree(Class ~ ., 数据=数据) 情节(x)