GridSearchCV 及其特征重要性
GridSearchCV and its feature importance
在 gridsearchCV 中,当我适合时如下所示:
forest_reg = RandomForestRegressor()
grid_search = GridSearchCV(forest_reg, param_grid,cv=5,scoring = 'neg_mean_squared_error')
grid_search.fit(X_train,y_train)
之后,
当我执行这个时,
GridSearch.best_estimator_.feature_importances_
它给出了一个值数组
所以我的问题是 GridSearch.best_estimator_.feature_importances_
这一行 return 的值是什么?
在您的例子中,GridSearch.best_estimator_.feature_importances_
returns 一个 RandomForestRegressor
对象。
因此,根据RandomForestRegressor
documentation:
feature_importances_ : array of shape = [n_features]
Return the feature importances (the higher, the more important the feature).
换句话说,它 returns 根据您的训练集 X_train
最重要的特征。 feature_importances_
的每个元素对应于 X_train
的一个特征(例如:feature_importances_
的第一个元素指的是 X_train
的第一个 feature/column)。
feature_importances_
中元素的值越高,X_train
中的特征越重要。
在 gridsearchCV 中,当我适合时如下所示:
forest_reg = RandomForestRegressor()
grid_search = GridSearchCV(forest_reg, param_grid,cv=5,scoring = 'neg_mean_squared_error')
grid_search.fit(X_train,y_train)
之后, 当我执行这个时,
GridSearch.best_estimator_.feature_importances_
它给出了一个值数组
所以我的问题是 GridSearch.best_estimator_.feature_importances_
这一行 return 的值是什么?
在您的例子中,GridSearch.best_estimator_.feature_importances_
returns 一个 RandomForestRegressor
对象。
因此,根据RandomForestRegressor
documentation:
feature_importances_ : array of shape = [n_features] Return the feature importances (the higher, the more important the feature).
换句话说,它 returns 根据您的训练集 X_train
最重要的特征。 feature_importances_
的每个元素对应于 X_train
的一个特征(例如:feature_importances_
的第一个元素指的是 X_train
的第一个 feature/column)。
feature_importances_
中元素的值越高,X_train
中的特征越重要。