H2o流量automl临时样品架
H2o flow automl temporary sample frame
我有一个大框架并使用 h2o flow 运行 automl 和深度学习算法。然而,训练指标是在“临时样本框架”上计算的。我找不到任何信息。我不确定 automl 是全帧 运行 还是临时帧。有人可以帮助理解或指点吗?顺便说一句,我觉得这个功能不方便。
这是深度学习模型的特例,AutoML 过程生成的任何其他模型都不是这种情况。出于效率原因(并且由于 H2O 是为非常大的数据集设计的),深度学习模型中的训练指标是在原始训练框架的子集上计算的。
H2O Deep Learning algorithm 中有一个名为 score_training_samples
的参数,默认为 10,000 行(并且由于我们进行近似抽样,也出于效率原因,实际子集大小为 9,993 是有道理的).
这应该是训练误差的一个很好的近似值。在 Flow 中改变这一点的唯一方法是手动训练深度学习模型(在 AutoML 过程之外)。
我有一个大框架并使用 h2o flow 运行 automl 和深度学习算法。然而,训练指标是在“临时样本框架”上计算的。我找不到任何信息。我不确定 automl 是全帧 运行 还是临时帧。有人可以帮助理解或指点吗?顺便说一句,我觉得这个功能不方便。
这是深度学习模型的特例,AutoML 过程生成的任何其他模型都不是这种情况。出于效率原因(并且由于 H2O 是为非常大的数据集设计的),深度学习模型中的训练指标是在原始训练框架的子集上计算的。
H2O Deep Learning algorithm 中有一个名为 score_training_samples
的参数,默认为 10,000 行(并且由于我们进行近似抽样,也出于效率原因,实际子集大小为 9,993 是有道理的).
这应该是训练误差的一个很好的近似值。在 Flow 中改变这一点的唯一方法是手动训练深度学习模型(在 AutoML 过程之外)。