部署时 h2o MOJO 与 POJO 之间的性能差异

Performance difference between h2o MOJO vs POJO when deploying

我已经使用 h2o.GLM 训练了一个二元分类器模型。我有大约 5-10 个特征。我想知道哪个在生产中会更快？

如果我训练的是随机森林模型而不是 GLM，这个答案会改变吗？

我需要获得约 1 亿行的分数。我已经在分发不同观察结果的评分了。

对于逻辑回归，POJO 或 MOJO 都可以。更喜欢 MOJO 以获得更好的向后兼容性。

深度大于6的Random Forest，一定要用MOJO。非常大（例如 1 GB 的 java 代码或更多）RF 模型甚至无法编译。

MOJO 不需要编译，这非常方便，对于非常深的树，它们运行更快并且具有非常一致的运行次。