如何在 Sklearn 中重塑我的测试数据？（特征选择）

How can I reshape my test data in Sklearn? (feature selection)

我有两个数据集，一个用于训练，另一个用于测试：

训练数据有 X_train.shape = (5000, 30) 和 y_train.shape = (5000, 1)
测试数据只有X_test.shape = (5000, 30)

在训练中，我应用了特征选择 (SelectKBest())，得到了一个新的形状 (5000, 10)。

问题从测试数据开始：没有输出，所以我不能应用SelectKBest()，因为它需要y_test。考虑到训练数据的新形状和新特征，我如何重塑测试数据？

人们很容易对 sklearn 转换器想得太多。在你问的评论中

Can I use get_support(True) to get index values...

工作量太大了！尝试

best=SelectKBest(*args).fit(X_train,y_train)
new_train=best.transform(X_train)
new_test=best.transform(X_test)

与使用 tfidftransformer 或 standardscaler 的方式相同