R中SVM概率的信用评分

Question

我正在尝试计算 R 中 germancredit 数据框的信用评分。我使用线性 SVM 分类器来预测 0 和 1（即 0 = 好，1 = 坏）。

我设法使用以下代码从 SVM 分类器生成概率。

final_pred = predict(classifier, newdata = data_treated[1:npredictors], decision.values = TRUE, probability = TRUE)

probs = attr(final_pred,"probabilities")

我想知道如何读取这些概率输出。样本输出在这里。以下输出是否意味着，如果预测为 1（默认） 在第五行 ，则概率为 0.53601166.

              0          1 Prediction
1    0.90312125 0.09687875 0
2    0.57899408 0.42100592 0
3    0.93079172 0.06920828 0
4    0.76600082 0.23399918 0
5    0.46398834 0.53601166 1

然后我可以使用上述各自的概率来开发信用评分卡，就像我们通常使用逻辑回归模型所做的那样

Answer 1

您会得到结果 0 或 1 的概率。每行的前两列总和为 1 并给出总体概率。您的解释对我来说似乎是正确的，即发生违约的概率为 0.53，而不是 p = 0.46 时不发生违约的概率。

是的，您可以使用该模型开发信用记分卡。请注意，您不一定需要使用 0.5 作为决定公司或个人 X 是否违约的临界值。

R中SVM概率的信用评分

credit score from SVM probabilities in R

r

machine-learning

risk-analysis

svm

libsvm