从最难分类的数据集中查找支持向量
Finding Support vectors from a dataset that are the hardest to classify
我正在尝试在 MNIST 数据集上训练 svm 分类器以区分两个字符。我正在使用 C=10 和 gamma=10^-6 的指数内核。我还打印了支持向量:
clfretrainC=svm.SVC(C=Cfinal,kernel="rbf",gamma=gammafinal)
clfretrainC.fit(ReTraintotx,ReTraintoty)
Pefinal=1-clfretrainC.score(Testtotx,Testtoty)
print "Test Error"
print Pefinal
print "Number of Support Vectors"
print clfretrainC.support_vectors_
print clfretrainC.support_vectors_.shape
sv=clfretrainC.support_vectors_
但是,我希望找到最接近分离超平面并因此最难分类的支持向量。是否有允许我执行此操作的功能?
如果没有,我该怎么做?
如果您查看 sklearn.svm.SVC 的文档,您会看到:
decision_function(X) Distance of the samples X to the separating hyperplane.
所以你可以这样做(对于 n 个最接近的向量)
clf.support_vectors_[np.abs(clf.decision_function(clf.support_vectors_)).argsort()[:n]]
我正在尝试在 MNIST 数据集上训练 svm 分类器以区分两个字符。我正在使用 C=10 和 gamma=10^-6 的指数内核。我还打印了支持向量:
clfretrainC=svm.SVC(C=Cfinal,kernel="rbf",gamma=gammafinal)
clfretrainC.fit(ReTraintotx,ReTraintoty)
Pefinal=1-clfretrainC.score(Testtotx,Testtoty)
print "Test Error"
print Pefinal
print "Number of Support Vectors"
print clfretrainC.support_vectors_
print clfretrainC.support_vectors_.shape
sv=clfretrainC.support_vectors_
但是,我希望找到最接近分离超平面并因此最难分类的支持向量。是否有允许我执行此操作的功能?
如果没有,我该怎么做?
如果您查看 sklearn.svm.SVC 的文档,您会看到:
decision_function(X) Distance of the samples X to the separating hyperplane.
所以你可以这样做(对于 n 个最接近的向量)
clf.support_vectors_[np.abs(clf.decision_function(clf.support_vectors_)).argsort()[:n]]