XGBoost - 使用 XGBRegressor 进行特征选择
XGBoost - Feature selection using XGBRegressor
我正在尝试通过 XGBRegressor()
执行特征选择(用于回归任务)。
更准确地说,我想知道:
- 如果有类似方法
feature_importances_
,与 XGBClassifier
一起使用,我可以将其用于回归。
- 如果 XGBoost 的方法
plot_importance()
在与 XGBRegressor()
一起使用时是可靠的
最后我通过以下方式解决了这个问题:
model.booster().get_score(importance_type='weight')
这是我的解决方案(Xnames 指的是功能名称):
def xgb_feature_importance(model_xgb, fnames=None):
b = model_xgb.booster()
fs = b.get_fscore()
all_features = [fs.get(f, 0.) for f in b.feature_names]
all_features = np.array(all_features, dtype=np.float32)
all_features_imp = all_features / all_features.sum()
if fnames is not None:
return pd.DataFrame({'X':fnames, 'IMP': all_features_imp})
else:
return all_features_imp
我正在尝试通过 XGBRegressor()
执行特征选择(用于回归任务)。
更准确地说,我想知道:
- 如果有类似方法
feature_importances_
,与XGBClassifier
一起使用,我可以将其用于回归。 - 如果 XGBoost 的方法
plot_importance()
在与XGBRegressor()
一起使用时是可靠的
最后我通过以下方式解决了这个问题:
model.booster().get_score(importance_type='weight')
这是我的解决方案(Xnames 指的是功能名称):
def xgb_feature_importance(model_xgb, fnames=None):
b = model_xgb.booster()
fs = b.get_fscore()
all_features = [fs.get(f, 0.) for f in b.feature_names]
all_features = np.array(all_features, dtype=np.float32)
all_features_imp = all_features / all_features.sum()
if fnames is not None:
return pd.DataFrame({'X':fnames, 'IMP': all_features_imp})
else:
return all_features_imp