如果我对训练数据进行数据预处理,是否有必要对测试数据进行同样的处理?
If I am performing data preprocessing on training data, is it necessary to perform the same on test data?
例如,如果我找到训练数据的mean
和variance
和normalize
,我是否应该使用相同的mean
和variance
用于测试数据还是我应该找到测试数据的 mean
和 variance
?
您应该使用在训练数据上使用的均值和方差。这确保了两组数据的处理方法是相同的,不应该使用看不见的(测试)集数据mean/variance。
例如,如果我找到训练数据的mean
和variance
和normalize
,我是否应该使用相同的mean
和variance
用于测试数据还是我应该找到测试数据的 mean
和 variance
?
您应该使用在训练数据上使用的均值和方差。这确保了两组数据的处理方法是相同的,不应该使用看不见的(测试)集数据mean/variance。