如何在 Sklearn 中重塑我的测试数据? (特征选择)

How can I reshape my test data in Sklearn? (feature selection)

我有两个数据集,一个用于训练,另一个用于测试:

在训练中,我应用了特征选择 (SelectKBest()),得到了一个新的形状 (5000, 10)

问题从测试数据开始:没有输出,所以我不能应用SelectKBest(),因为它需要y_test。考虑到训练数据的新形状和新特征,我如何重塑测试数据?

人们很容易对 sklearn 转换器想得太多。在你问的评论中

Can I use get_support(True) to get index values...

工作量太大了! 尝试

best=SelectKBest(*args).fit(X_train,y_train)
new_train=best.transform(X_train)
new_test=best.transform(X_test)

与使用 tfidftransformer 或 standardscaler 的方式相同