如何在 Sklearn 中重塑我的测试数据? (特征选择)
How can I reshape my test data in Sklearn? (feature selection)
我有两个数据集,一个用于训练,另一个用于测试:
- 训练数据有
X_train.shape = (5000, 30)
和 y_train.shape = (5000, 1)
- 测试数据只有
X_test.shape = (5000, 30)
在训练中,我应用了特征选择 (SelectKBest()
),得到了一个新的形状 (5000, 10)
。
问题从测试数据开始:没有输出,所以我不能应用SelectKBest()
,因为它需要y_test
。考虑到训练数据的新形状和新特征,我如何重塑测试数据?
人们很容易对 sklearn 转换器想得太多。在你问的评论中
Can I use get_support(True) to get index values...
工作量太大了!
尝试
best=SelectKBest(*args).fit(X_train,y_train)
new_train=best.transform(X_train)
new_test=best.transform(X_test)
与使用 tfidftransformer 或 standardscaler 的方式相同
我有两个数据集,一个用于训练,另一个用于测试:
- 训练数据有
X_train.shape = (5000, 30)
和y_train.shape = (5000, 1)
- 测试数据只有
X_test.shape = (5000, 30)
在训练中,我应用了特征选择 (SelectKBest()
),得到了一个新的形状 (5000, 10)
。
问题从测试数据开始:没有输出,所以我不能应用SelectKBest()
,因为它需要y_test
。考虑到训练数据的新形状和新特征,我如何重塑测试数据?
人们很容易对 sklearn 转换器想得太多。在你问的评论中
Can I use get_support(True) to get index values...
工作量太大了! 尝试
best=SelectKBest(*args).fit(X_train,y_train)
new_train=best.transform(X_train)
new_test=best.transform(X_test)
与使用 tfidftransformer 或 standardscaler 的方式相同