MultilayerPerceptronClassifier (SPARK) 的特征格式
Feature format for MultilayerPerceptronClassifier (SPARK)
我见过一些示例,其中特征的输入数据只是任何双精度值。
我想知道是否需要将 MultilayerPerceptronClassifier 的输入特征标准化到范围 [-1,1] 或 [0,1]。
我在 Spark 文档中找不到该信息。
https://spark.apache.org/docs/latest/ml-classification-regression.html#multilayer-perceptron-classifier
也许这是我必须根据结果来决定的事情..
.. 那么我可能想使用其中之一:
归一化器
StandardScaler
最小最大缩放器
MaxAbsScaler
是的,您应该将它们标准化。这并不特定于任何框架,而是神经网络的一般良好实践。如果您不规范化输入和输出,您可能 运行 陷入学习问题。
无论是 [0,1 ] 还是 [-1,1],两者都同样有效。可能差别不大。
我见过一些示例,其中特征的输入数据只是任何双精度值。
我想知道是否需要将 MultilayerPerceptronClassifier 的输入特征标准化到范围 [-1,1] 或 [0,1]。
我在 Spark 文档中找不到该信息。 https://spark.apache.org/docs/latest/ml-classification-regression.html#multilayer-perceptron-classifier
也许这是我必须根据结果来决定的事情.. .. 那么我可能想使用其中之一:
是的,您应该将它们标准化。这并不特定于任何框架,而是神经网络的一般良好实践。如果您不规范化输入和输出,您可能 运行 陷入学习问题。
无论是 [0,1 ] 还是 [-1,1],两者都同样有效。可能差别不大。