XGBoost 具有更多功能重要性的功能,但准确性较低
XGBoost features with more feature importance giving less accuracy
我的模型有六个特征 f1,f2,f3,f4,f5 and f6
。
并且特征重要性得分是有序的
f1>f2>f3>f4>f5>f6
但具有特征 f1,f4 and f5
的模型的 rmse 小于具有特征 f1,f2,f3,f4,f5 and f6
的模型或具有特征 f1,f2,f3
的模型的 rmse。这有什么可能的原因吗?
没有数据很难猜。
然而,这通常是由相关特征引起的。
因此,如果 f2==f1
,那么将 f2
添加到已经包含 f1
的模型中将不会提供任何值。但是,添加一个不相关的特征,例如f4
即使这样还能加很多f2 > f1
我的模型有六个特征 f1,f2,f3,f4,f5 and f6
。
并且特征重要性得分是有序的
f1>f2>f3>f4>f5>f6
但具有特征 f1,f4 and f5
的模型的 rmse 小于具有特征 f1,f2,f3,f4,f5 and f6
的模型或具有特征 f1,f2,f3
的模型的 rmse。这有什么可能的原因吗?
没有数据很难猜。
然而,这通常是由相关特征引起的。
因此,如果 f2==f1
,那么将 f2
添加到已经包含 f1
的模型中将不会提供任何值。但是,添加一个不相关的特征,例如f4
即使这样还能加很多f2 > f1