在训练具有重要特征的随机森林时准确率较低

Got lower accuracy while training Random Forest with important features

我正在使用随机森林进行二元分类。

当我使用所有特征(10 个特征)进行训练时,它给了我 85% 的准确率。

训练后,我可视化了重要特征。说明2个特征真的很重要。

所以我只选择了两个重要的特征并训练了 RF(使用相同的设置)但是准确率下降了(0.70 %)。

会发生吗?我期待更高的准确性。

在这种情况下,我该怎么做才能提高准确性?

谢谢

使用随机森林时的一般经验法则是包括所有 可观察数据。这样做的原因是先验的,我们不知道哪些特征可能会影响响应和模型。仅仅因为您发现只有少数特征具有很强的影响力,并不意味着其余特征在模型中不起作用。

因此,在训练随机森林模型时,您应该坚持只包含所有特征。如果某些特征没有提高准确性,它们将在训练期间 removed/ignored。您通常不需要在训练时通过删除任何功能进行手动补救。