RandomForest 是否需要规范化?
Is normalization necessary for RandomForest?
1) 随机森林是否需要归一化?
2) 应该对所有特征进行归一化还是仅对数值特征进行归一化?
3) 在拆分成训练数据和测试数据之前或之后进行归一化是否重要?
4)我是否需要对未来要分类的对象的特征进行预处理? (接受模型后,而不是在测试期间)
1) 否!任何基于树的分类器都不需要特征归一化。
2) 一般来说,规范化应该在所有特征上进行,而不仅仅是数值特征。
3) 在实践中并没有太大区别。然而,正确的做法是从训练集中识别出每个特征的最小值和最大值,然后根据这些值。
4) 是的,之后 any 需要分类的样本应该用 exactly 处理,就像你在训练期间所做的那样.
1) 随机森林是否需要归一化?
2) 应该对所有特征进行归一化还是仅对数值特征进行归一化?
3) 在拆分成训练数据和测试数据之前或之后进行归一化是否重要?
4)我是否需要对未来要分类的对象的特征进行预处理? (接受模型后,而不是在测试期间)
1) 否!任何基于树的分类器都不需要特征归一化。
2) 一般来说,规范化应该在所有特征上进行,而不仅仅是数值特征。
3) 在实践中并没有太大区别。然而,正确的做法是从训练集中识别出每个特征的最小值和最大值,然后根据这些值。
4) 是的,之后 any 需要分类的样本应该用 exactly 处理,就像你在训练期间所做的那样.