h2o AutoML - 从 autoML 重新训练堆叠集成 - 预处理数据

h2o AutoML - retrain stacked ensemble from autoML - preprocessing the data

我在 python 上使用 h2o autoML。

我使用 autoML 部分找到了可能的最佳模型:它是 StackedEnsemble。

现在我想采用模型并在更大的数据集上重新训练它(这在以前是不可能的,因为我会爆炸 google colab 可用 RAM 容量)。

但是 AutoML 对我的数据做了一些预处理,我不知道是哪一个。

如何获得预处理步骤,以便在将其提供给模型之前将其重新应用于我的更大的数据?

提前致谢,

嘎嘎

Stacked Ensemble 是一种基于其他模型输出的模型。要 re-train SE 模型,您需要 re-train 各个模型。

除此之外,AutoML 不会 pre-process 数据。它将 pre-processing 委托给下游模型。有一个例外 - 目标编码。

您是否在 AutoML 中启用了 TE?