XGBoost 具有更多功能重要性的功能,但准确性较低

XGBoost features with more feature importance giving less accuracy

我的模型有六个特征 f1,f2,f3,f4,f5 and f6。 并且特征重要性得分是有序的

f1>f2>f3>f4>f5>f6 

但具有特征 f1,f4 and f5 的模型的 rmse 小于具有特征 f1,f2,f3,f4,f5 and f6 的模型或具有特征 f1,f2,f3 的模型的 rmse。这有什么可能的原因吗?

没有数据很难猜。 然而,这通常是由相关特征引起的。 因此,如果 f2==f1,那么将 f2 添加到已经包含 f1 的模型中将不会提供任何值。但是,添加一个不相关的特征,例如f4即使这样还能加很多f2 > f1