RandomForest 是否需要规范化?

Is normalization necessary for RandomForest?

1) 随机森林是否需要归一化?

2) 应该对所有特征进行归一化还是仅对数值特征进行归一化?

3) 在拆分成训练数据和测试数据之前或之后进行归一化是否重要?

4)我是否需要对未来要分类的对象的特征进行预处理? (接受模型后,而不是在测试期间)

1) !任何基于树的分类器都不需要特征归一化。

2) 一般来说,规范化应该在所有特征上进行,而不仅仅是数值特征。

3) 在实践中并没有太大区别。然而,正确的做法是从训练集中识别出每个特征的最小值和最大值,然后根据这些值。

4) 是的,之后 any 需要分类的样本应该用 exactly 处理,就像你在训练期间所做的那样.