您是否对训练和测试数据分别应用最小最大缩放比例?

Do you apply min max scaling separately on training and test data?

在应用最小最大缩放来规范化特征时,您是否在将整个数据集拆分为训练、验证和测试数据之前对其应用最小最大缩放?

或者您是先拆分然后在每个集合上应用最小最大值,使用特定集合中的最小值和最大值?

最后,在对新输入进行预测时,是否应该在输入网络之前使用训练数据中的最小值、最大值对该输入的特征进行归一化?

拆分它,然后缩放。想象一下:你不知道真实世界的数据是什么样的,所以你无法将训练数据扩展到它。您的测试数据是真实数据的替代品,因此您应该以同样的方式对待它。

重申一下:拆分、缩放训练数据,然后将训练数据的缩放比例用于测试数据。