如何区分重要特征的方向是xgboost还是随机森林?
How to distinguish the direction of important features from xgboost or random forest?
我现在正在研究二进制文本分类问题(如情感分析),仅通过 feature_importances_
提取 xgboost 或随机森林的最重要特征是微不足道的
假设对于这个分类问题我们有两个标签 1 和 0。那有什么方法可以打印出特征的方向(正或负)?比如说,词特征 A 具有丰富或高 tfidf 标签 1.
当然可以把这个词特征的tfidf列拉出来,用pearson系数和labeling关联起来,系数的+/-就表示方向了吧?这个或 xgboost 和随机森林的任何其他更优雅的方式都内置了这样的功能。 (没找到)
谢谢
我现在正在研究二进制文本分类问题(如情感分析),仅通过 feature_importances_
假设对于这个分类问题我们有两个标签 1 和 0。那有什么方法可以打印出特征的方向(正或负)?比如说,词特征 A 具有丰富或高 tfidf 标签 1.
当然可以把这个词特征的tfidf列拉出来,用pearson系数和labeling关联起来,系数的+/-就表示方向了吧?这个或 xgboost 和随机森林的任何其他更优雅的方式都内置了这样的功能。 (没找到)
谢谢