提取用于在 H2O 中构建每棵树的特征样本

Extract sample of features used to build each tree in H2O

在 GBM 模型中,使用了以下参数 -

我了解抽样的工作原理以及在每棵树的每个级别进行拆分时考虑了多少变量。我试图了解每个功能在做出决定时被考虑了多少次。有没有一种方法可以轻松地从模型对象中提取用于做出分裂决策的所有特征样本?

参考H2O提供的解释,http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/col_sample_rate.html,有没有办法知道每次拆分的60个随机选择的特征?

感谢您的帮助!

我不知道我是否会称之为简单,但 MOJO 树可视化工具吐出一个 graphviz 点数据文件,该文件已转换为可视化。这里有您感兴趣的信息。

http://docs.h2o.ai/h2o/latest-stable/h2o-genmodel/javadoc/overview-summary.html#viewing-a-mojo

如果您想查看给定树中的给定拆分使用了哪些功能,您可以导航 H2OTree 对象。

对于 R,请参阅文档 here and here

对于 Python,请参阅文档 here

你也可以看看这个 Blog(如果这个 link 死了就做一个 google 搜索 H2OTree class)