将预测值与其 index/identification 数相关联

Relate the predicted value to it index/identification number

我正在训练一个模型来根据一些数据预测真假。我在训练和测试模型时从功能列表中删除了产品编号。

X = df.drop(columns = 'Product Number', axis = 1)
y = df['result']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)

SVC = LinearSVC(max_iter = 1200)
SVC.fit(X_train, y_train)
y_pred = SVC.predict(X_test)

我有什么方法可以恢复已通过或未通过的项目的产品编号及其功能?如何get/relate y_pred 的结果对应哪个产品编号?

我还计划使用交叉验证来打乱数据,我还有办法恢复每个测试项目的产品编号吗?

我意识到我使用交叉验证只是为了评估我的模型的性能,所以我决定只 运行 我的代码而不打乱数据以查看每个数据点的结果。

编辑: 对于没有交叉验证的评估,我只在将不相关的列传递给分类器时才删除不相关的列,如下所示:

cols = ['id', 'label']
X = train_data.copy()
y = train_data['label']
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=2)

knn = make_pipeline(StandardScaler(),KNeighborsClassifier(n_neighbors=10))
y_val_pred = knn.fit(X_train.drop(columns=cols), y_train).predict(X_val.drop(columns=cols))

X_val['y_val_pred'] = y_val_pred

我在预测后加入 y_val_pred 以检查哪些数据点被错误分类。