h2o 检查点到底有什么作用?

What do h2o checkpoints really do?

h2o 检查点的实际作用是什么?是否使用 say

创建模型
gbm_continued = H2OGradientBoostingEstimator(checkpoint= gbm_orig.model_id, ntrees = 50, seed = 1234)

意味着如果我们不在任何新数据上对其进行训练,gbm_continued 将具有与 gbm_orig 相同的参数和预测性能?

docs,说“这将构建一个新模型作为先前生成模型的延续”,但我很困惑 "continuation"实际上暗示。一个解释将不胜感激。谢谢

关键参数是 ntreesepochs 用于深度学习模型)。我将引用我自己的书(Practical Machine Learning with H2O,p.103):

When specifying epochs, or the number of trees, specify the total amount of training you want if you had started from scratch, not how many additional epochs or trees you want.

因此,在您的情况下,如果您的原始模型是用 50 棵树制作的,那么您的新模型实际上只会复制现有模型。但是,如果您的原始模型是使用 ntrees = 20 制作的,而您的新模型将其用作检查点但使用 ntrees = 50,那么它将向模型添加 30 多棵树。

有些参数必须保持不变,但有些可以更改。例如。你可能会降低学习率。