特征缩放
Feature Scaling
我是从 post 上读到的,有人说:
对于特征缩放,您学习训练集的均值和标准差,然后:
- 使用训练集均值对训练集进行标准化,并且
标准偏差。
- 使用训练集均值和标准对任何测试集进行标准化
偏差。
但现在我的问题是,在使用缩放训练数据拟合模型后,我应该将这个拟合模型应用于缩放或未缩放测试数据吗?谢谢!
是的,你也应该缩放测试数据。如果你已经缩放了你的训练数据并将模型拟合到该缩放数据,那么测试集也应该进行等效的预处理以及。这是标准做法,因为它确保始终为模型提供形式一致的数据集作为输入。
在 Python 中,过程可能如下所示:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
another thread 上有一篇关于此主题的详细文章,您可能会感兴趣。
我是从 post 上读到的,有人说:
对于特征缩放,您学习训练集的均值和标准差,然后:
- 使用训练集均值对训练集进行标准化,并且 标准偏差。
- 使用训练集均值和标准对任何测试集进行标准化 偏差。
但现在我的问题是,在使用缩放训练数据拟合模型后,我应该将这个拟合模型应用于缩放或未缩放测试数据吗?谢谢!
是的,你也应该缩放测试数据。如果你已经缩放了你的训练数据并将模型拟合到该缩放数据,那么测试集也应该进行等效的预处理以及。这是标准做法,因为它确保始终为模型提供形式一致的数据集作为输入。
在 Python 中,过程可能如下所示:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
another thread 上有一篇关于此主题的详细文章,您可能会感兴趣。