sklearn 库中 .score() 和 .predict 的区别?

Difference between .score() and .predict in the sklearn library?

我已经使用带有以下代码的 sklearn 库实例化了一个 SVC 对象:

clf = svm.SVC(kernel='linear', C=1, cache_size=1000, max_iter = -1, verbose = True)

然后我使用以下方法为其拟合数据:

model = clf.fit(X_train, y_train)

其中X_train是一个(301,60)而y_train是(301,)ndarray(y_train由class标签组成"1","2 " 和 "3").

现在,在我偶然发现 .score() 方法之前,为了确定我的模型在训练集上的准确性,我使用了以下方法:

prediction = np.divide((y_train == model.predict(X_train)).sum(), y_train.size, dtype = float)

结果大约为 62%。

然而,当使用 model.score(X_train, y_train) 方法时,我得到了大约 83% 的结果。

因此,我想知道是否有人可以向我解释为什么会这样,因为据我了解,他们应该 return 得到相同的结果?

附录:

y_true 的前 10 个值是:

而对于 y_pred(当使用 model.predict(X_train) 时),它们是:

因为你的 y_train(301, 1) 而不是 (301,) numpy 进行广播,所以

(y_train == model.predict(X_train)).shape == (301, 301)

这不是您想要的。 您的代码的正确版本是

np.mean(y_train.ravel() == model.predict(X_train))

这将给出与

相同的结果
model.score(X_train, y_train)