部署时 h2o MOJO 与 POJO 之间的性能差异

Performance difference between h2o MOJO vs POJO when deploying

我已经使用 h2o.GLM 训练了一个二元分类器模型。我有大约 5-10 个特征。我想知道哪个在生产中会更快?

  1. 在我的 java 代码中编码逻辑回归。
  2. 通过 h2o 使用 POJO。
  3. 使用 h2o 生成的 MOJO。

如果我训练的是随机森林模型而不是 GLM,这个答案会改变吗?

我需要获得约 1 亿行的分数。我已经在分发​​不同观察结果的评分了。

对于逻辑回归,POJO 或 MOJO 都可以。更喜欢 MOJO 以获得更好的向后兼容性。

深度大于6的Random Forest,一定要用MOJO。非常大(例如 1 GB 的 java 代码或更多)RF 模型甚至无法编译。

MOJO 不需要编译,这非常方便,对于非常深的树,它们 运行 更快并且具有非常一致的 运行 次。