H2O AutoML 如何处理因子变量?

How does H2O AutoML treat factor variables?

我目前正在使用 H2O's AutoML 进行数据科学项目。但是,在文档、互联网或代码中,我找不到任何地方可以找到 AutoML 如何处理因子变量——它是否进行单热编码?标签编码?更高级的东西?有没有考虑到有多少层?是否取决于算法?

目前,AutoML 的表现非常糟糕(略高于基线),我怀疑这是因为它没有正确处理分类变量,分类变量占我预测变量的大约 90%。

AutoML 自动运行 H2O-3 中可用的监督学习模型。因此,AutoML 如何处理分类取决于给定模型的默认分类处理 运行。可以找到有关处理分类值的文档 here,如果您对特定算法感兴趣,请使用相同的文档来查找您感兴趣的算法并查看其如何处理分类值的详细信息或使用 Python或 R API 文档以查找默认值。