随机森林中每个特征级别的重要性顺序

Order of importance for each level of a feature in Random Forest

使用 SciKitLearn 的随机森林分类器拟合模型后,我得到了特征重要性列表,但我能得到特征级别的重要性吗?

例如,如果我得到以下系列的特征重要性,我如何才能看出哪个 day_of_week 最重要?

online_users            0.107735
number_of_post          0.051478
day_of_week             0.042552
total_votes             0.131286
polarity                0.033352

我认为您可以为 day_of_week 创建一个虚拟变量,然后在合并虚拟变量并删除 day_of_week 后 运行 特征对新特征集的重要性 day_of_week。

pd.get_dummies(df['day_of_week'])