h2o AutoML - 从 autoML 重新训练堆叠集成 - 预处理数据

h2o AutoML - retrain stacked ensemble from autoML - preprocessing the data

我在 python 上使用 h2o autoML。

我使用 autoML 部分找到了可能的最佳模型：它是 StackedEnsemble。

现在我想采用模型并在更大的数据集上重新训练它（这在以前是不可能的，因为我会爆炸 google colab 可用 RAM 容量）。

但是 AutoML 对我的数据做了一些预处理，我不知道是哪一个。

如何获得预处理步骤，以便在将其提供给模型之前将其重新应用于我的更大的数据？

提前致谢，

嘎嘎

Stacked Ensemble 是一种基于其他模型输出的模型。要 re-train SE 模型，您需要 re-train 各个模型。

除此之外，AutoML 不会 pre-process 数据。它将 pre-processing 委托给下游模型。有一个例外 - 目标编码。

您是否在 AutoML 中启用了 TE？