h2o4gpu 是否处理像 sklearn 或 h2o 这样的分类特征?

Does h2o4gpu handle categorical features like sklearn or like h2o?

我理解 sklearn 需要在 运行 sklearn.ensemble.RandomForestRegressor 方法时将分类特征编码为虚拟变量或单热编码,并且 XGBoost 需要相同,但 h2o 允许在其 h2o.estimators.random_forest.H2ORandomForestEstimator 方法中使用原始分类特征。由于 h2o4gpu 的随机森林实现是建立在 XGBoost 之上的,这是否意味着不包括对原始分类特征的支持?

h2o4gpu 中没有对分类列的本机支持(至少现在是这样),因此您必须像您一样对分类列进行一次性编码(或标签编码)在 sklearnxgboost 中执行。