机器学习算法的规范化输入

Question

我想对许多机器学习算法（神经网络）和对数回归的预测变量进行归一化（z-score、minmax 等），我想知道：

1) 我应该规范化整个预测变量，即训练和测试数据吗？

2) 是否应该规范化我的预测变量，y？

Answer 1

1) 正确的步骤是对训练数据进行归一化，然后使用转换参数对测试数据进行归一化。这是一个具有一个特征的 minmax 规范化示例：

training = [1, 2, 3]
test = [0, 4]

归一化后的数据如下：

training_normalized = [0.0, 0.5, 1.0]
test_normalized = [-0.5, 1.5]

2) 通常答案是否定的，但在某些情况下它可能有助于转换目标变量。在任何情况下，您都应该确保模型的输出能够匹配目标变量。

Normalizing Input for Machine Learning Algorithm