GridSearchCV 及其特征重要性

GridSearchCV and its feature importance

在 gridsearchCV 中,当我适合时如下所示:

forest_reg = RandomForestRegressor()
grid_search = GridSearchCV(forest_reg, param_grid,cv=5,scoring = 'neg_mean_squared_error')
grid_search.fit(X_train,y_train)

之后, 当我执行这个时,

GridSearch.best_estimator_.feature_importances_ 

它给出了一个值数组 所以我的问题是 GridSearch.best_estimator_.feature_importances_ 这一行 return 的值是什么?

在您的例子中,GridSearch.best_estimator_.feature_importances_ returns 一个 RandomForestRegressor 对象。

因此,根据RandomForestRegressordocumentation

feature_importances_ : array of shape = [n_features] Return the feature importances (the higher, the more important the feature).

换句话说,它 returns 根据您的训练集 X_train 最重要的特征。 feature_importances_ 的每个元素对应于 X_train 的一个特征(例如:feature_importances_ 的第一个元素指的是 X_train 的第一个 feature/column)。

feature_importances_中元素的值越高,X_train中的特征越重要。