如何区分重要特征的方向是xgboost还是随机森林?

How to distinguish the direction of important features from xgboost or random forest?

我现在正在研究二进制文本分类问题(如情感分析),仅通过 feature_importances_

提取 xgboost 或随机森林的最重要特征是微不足道的

假设对于这个分类问题我们有两个标签 1 和 0。那有什么方法可以打印出特征的方向(正或负)?比如说,词特征 A 具有丰富或高 tfidf 标签 1.

当然可以把这个词特征的tfidf列拉出来,用pearson系数和labeling关联起来,系数的+/-就表示方向了吧?这个或 xgboost 和随机森林的任何其他更优雅的方式都内置了这样的功能。 (没找到)

谢谢

这并不完全符合您的要求,但我通常使用 Lime 来执行此操作。即使我切换模型,我也喜欢它的工作方式。

除了 Lime(Sam H 建议的)之外,SHAP 也是一个选项。