h2o 随机森林 MOJO 中的辅助树数据

Auxiliary tree data in h2o's MOJOs for random forest

h2o 的随机森林算法的 MOJO zip 文件似乎包含 "auxiliary" 树数据,约占 MOJO 文件总大小的 75%。

  1. 这个辅助树数据到底是用来做什么的?
  2. 仅执行预测的已部署模型是否需要此数据?
  3. 如果不是,是否可以在调用时省略存储辅助数据h2o.download_mojo

感谢您的帮助。

  1. 统计。

例如,每个子节点的加权行数。

你可以在这里查看AuxInfo数据结构:

MOJO 打印工具有一个特殊标志 (--detail) 可以打印出这些信息。

查看这里使用的工具:

  1. 严格来说,不是。预测计算不需要"aux"信息。

然而,如果该信息不存在,我猜测当前 Java genmodel reader 代码 (3.16.0.4) 可能无法正确解析。

(您可以通过解压缩 mojo、删除该 aux 文件并再次重新压缩来尝试自己。)

  1. 不,从当前版本 (3.16.0.4) 开始,此功能不存在。