使用 H2O GBM 模型的 MOJO 文件重现预测
Reproduce predictions with MOJO file of a H2O GBM model
我使用 H2O 版本 3.26.0.5 在二元问题中训练 GBM 模型,以预测正概率 class。我将模型文件保存为 MOJO 并使用此文件在新数据中生成预测:
## first, restart R session ##
# load the model
library(h2o)
h2o.init(nthreads = -1)
model <- h2o.import_mojo("path_to_mojo_file")
# load the new data input
input <- read_csv("path_to_new_data")
input_h2o <- as.h2o(input)
# predictions
predictions <- predict(model, input_h2o)
当我 运行 在我的计算机中执行此操作时,我得到的预测与我在生产环境中使用相同的 MOJO 文件进行预测时得到的预测不同。
MOJO 文件会发生这种情况吗?我相信一旦模型以 MOJO 格式保存,您就可以在任何环境中进行预测并获得相同的结果。有谁知道为什么会这样?
When I run this in my computer I get different predictions than when I use the same MOJO file to predict in a production environment.
生产环境运行是完全一样的R脚本吗?
最后发现是生产环境的脚本出错了。修复后,预测变得非常接近。
我使用 H2O 版本 3.26.0.5 在二元问题中训练 GBM 模型,以预测正概率 class。我将模型文件保存为 MOJO 并使用此文件在新数据中生成预测:
## first, restart R session ##
# load the model
library(h2o)
h2o.init(nthreads = -1)
model <- h2o.import_mojo("path_to_mojo_file")
# load the new data input
input <- read_csv("path_to_new_data")
input_h2o <- as.h2o(input)
# predictions
predictions <- predict(model, input_h2o)
当我 运行 在我的计算机中执行此操作时,我得到的预测与我在生产环境中使用相同的 MOJO 文件进行预测时得到的预测不同。
MOJO 文件会发生这种情况吗?我相信一旦模型以 MOJO 格式保存,您就可以在任何环境中进行预测并获得相同的结果。有谁知道为什么会这样?
When I run this in my computer I get different predictions than when I use the same MOJO file to predict in a production environment.
生产环境运行是完全一样的R脚本吗?
最后发现是生产环境的脚本出错了。修复后,预测变得非常接近。