H2o流量automl临时样品架

H2o flow automl temporary sample frame

我有一个大框架并使用 h2o flow 运行 automl 和深度学习算法。然而,训练指标是在“临时样本框架”上计算的。我找不到任何信息。我不确定 automl 是全帧 运行 还是临时帧。有人可以帮助理解或指点吗?顺便说一句,我觉得这个功能不方便。

这是深度学习模型的特例,AutoML 过程生成的任何其他模型都不是这种情况。出于效率原因(并且由于 H2O 是为非常大的数据集设计的),深度学习模型中的训练指标是在原始训练框架的子集上计算的。

H2O Deep Learning algorithm 中有一个名为 score_training_samples 的参数,默认为 10,000 行(并且由于我们进行近似抽样,也出于效率原因,实际子集大小为 9,993 是有道理的).

这应该是训练误差的一个很好的近似值。在 Flow 中改变这一点的唯一方法是手动训练深度学习模型(在 AutoML 过程之外)。