随机森林中每个特征级别的重要性顺序
Order of importance for each level of a feature in Random Forest
使用 SciKitLearn 的随机森林分类器拟合模型后,我得到了特征重要性列表,但我能得到特征级别的重要性吗?
例如,如果我得到以下系列的特征重要性,我如何才能看出哪个 day_of_week 最重要?
online_users 0.107735
number_of_post 0.051478
day_of_week 0.042552
total_votes 0.131286
polarity 0.033352
我认为您可以为 day_of_week 创建一个虚拟变量,然后在合并虚拟变量并删除 day_of_week 后 运行 特征对新特征集的重要性 day_of_week。
pd.get_dummies(df['day_of_week'])
使用 SciKitLearn 的随机森林分类器拟合模型后,我得到了特征重要性列表,但我能得到特征级别的重要性吗?
例如,如果我得到以下系列的特征重要性,我如何才能看出哪个 day_of_week 最重要?
online_users 0.107735
number_of_post 0.051478
day_of_week 0.042552
total_votes 0.131286
polarity 0.033352
我认为您可以为 day_of_week 创建一个虚拟变量,然后在合并虚拟变量并删除 day_of_week 后 运行 特征对新特征集的重要性 day_of_week。
pd.get_dummies(df['day_of_week'])