h2o4gpu 是否处理像 sklearn 或 h2o 这样的分类特征?
Does h2o4gpu handle categorical features like sklearn or like h2o?
我理解 sklearn
需要在 运行 sklearn.ensemble.RandomForestRegressor
方法时将分类特征编码为虚拟变量或单热编码,并且 XGBoost
需要相同,但 h2o
允许在其 h2o.estimators.random_forest.H2ORandomForestEstimator
方法中使用原始分类特征。由于 h2o4gpu
的随机森林实现是建立在 XGBoost
之上的,这是否意味着不包括对原始分类特征的支持?
h2o4gpu 中没有对分类列的本机支持(至少现在是这样),因此您必须像您一样对分类列进行一次性编码(或标签编码)在 sklearn 和 xgboost 中执行。
我理解 sklearn
需要在 运行 sklearn.ensemble.RandomForestRegressor
方法时将分类特征编码为虚拟变量或单热编码,并且 XGBoost
需要相同,但 h2o
允许在其 h2o.estimators.random_forest.H2ORandomForestEstimator
方法中使用原始分类特征。由于 h2o4gpu
的随机森林实现是建立在 XGBoost
之上的,这是否意味着不包括对原始分类特征的支持?
h2o4gpu 中没有对分类列的本机支持(至少现在是这样),因此您必须像您一样对分类列进行一次性编码(或标签编码)在 sklearn 和 xgboost 中执行。