支持向量机预测文件中大于 1 的值

Values greater than 1 in svm prediction file

我正在使用 svm light 训练二元分类模型。使用该模型,我测试了一些示例。我很惊讶地看到预测文件的输出,它包含大于 1 和小于 -1 的值。我认为范围是 [-1,1]。我做错了什么吗?

如果您了解 SVM 的工作原理,那么为什么这些值不受 [-1, 1] 区间的限制是有道理的。 SVM 尝试绘制分隔负数据点和正数据点的线,同时最大化它们与线的距离。

预测文件中的值表示数据与SVM最优超平面的距离,其中正值在超平面的正class侧,负值在负class侧超平面的一侧。这些距离可以任意大或小,并且不受此图像所见:

我见过一些 SVM 实现,例如 Weka's implementation of Platt's SMO,它们对值进行归一化,以便它们是正 class 的置信值,以 [0, 1] 的区间为界,但两者方法可以很好地确定支持向量机对class化的信心程度,因为远离超平面的数据点比靠近超平面的数据点更确定。