R中SVM概率的信用评分
credit score from SVM probabilities in R
我正在尝试计算 R 中 germancredit 数据框的信用评分。我使用线性 SVM 分类器来预测 0 和 1(即 0 = 好,1 = 坏)。
我设法使用以下代码从 SVM 分类器生成概率。
final_pred = predict(classifier, newdata = data_treated[1:npredictors], decision.values = TRUE, probability = TRUE)
probs = attr(final_pred,"probabilities")
我想知道如何读取这些概率输出。样本输出在这里。
以下输出是否意味着,如果预测为 1(默认) 在第五行 ,则概率为 0.53601166.
0 1 Prediction
1 0.90312125 0.09687875 0
2 0.57899408 0.42100592 0
3 0.93079172 0.06920828 0
4 0.76600082 0.23399918 0
5 0.46398834 0.53601166 1
然后我可以使用上述各自的概率来开发信用评分卡,就像我们通常使用逻辑回归模型所做的那样
您会得到结果 0 或 1 的概率。每行的前两列总和为 1 并给出总体概率。您的解释对我来说似乎是正确的,即发生违约的概率为 0.53,而不是 p = 0.46 时不发生违约的概率。
是的,您可以使用该模型开发信用记分卡。请注意,您不一定需要使用 0.5 作为决定公司或个人 X 是否违约的临界值。
我正在尝试计算 R 中 germancredit 数据框的信用评分。我使用线性 SVM 分类器来预测 0 和 1(即 0 = 好,1 = 坏)。
我设法使用以下代码从 SVM 分类器生成概率。
final_pred = predict(classifier, newdata = data_treated[1:npredictors], decision.values = TRUE, probability = TRUE)
probs = attr(final_pred,"probabilities")
我想知道如何读取这些概率输出。样本输出在这里。 以下输出是否意味着,如果预测为 1(默认) 在第五行 ,则概率为 0.53601166.
0 1 Prediction
1 0.90312125 0.09687875 0
2 0.57899408 0.42100592 0
3 0.93079172 0.06920828 0
4 0.76600082 0.23399918 0
5 0.46398834 0.53601166 1
然后我可以使用上述各自的概率来开发信用评分卡,就像我们通常使用逻辑回归模型所做的那样
您会得到结果 0 或 1 的概率。每行的前两列总和为 1 并给出总体概率。您的解释对我来说似乎是正确的,即发生违约的概率为 0.53,而不是 p = 0.46 时不发生违约的概率。
是的,您可以使用该模型开发信用记分卡。请注意,您不一定需要使用 0.5 作为决定公司或个人 X 是否违约的临界值。