机器学习算法的规范化输入

Normalizing Input for Machine Learning Algorithm

我想对许多机器学习算法(神经网络)和对数回归的预测变量进行归一化(z-score、minmax 等),我想知道:

1) 我应该规范化整个预测变量,即训练和测试数据吗?

2) 是否应该规范化我的预测变量,y?

1) 正确的步骤是对训练数据进行归一化,然后使用转换参数对测试数据进行归一化。这是一个具有一个特征的 minmax 规范化示例:

training = [1, 2, 3]
test = [0, 4]

归一化后的数据如下:

training_normalized = [0.0, 0.5, 1.0]
test_normalized = [-0.5, 1.5]

2) 通常答案是否定的,但在某些情况下它可能有助于转换目标变量。在任何情况下,您都应该确保模型的输出能够匹配目标变量。