将 sklearn precision_recall_curve 函数与不同的分类器一起使用

Using sklearn precision_recall_curve function with different classifiers

这可能是一个简单的问题,但我需要帮助了解如何在 sklearn 中使用 precision_recall_curve 函数。

我有一个二进制数据集,我正在使用三个分类器(SVMRFLR)对其进行分类。

sklearn 文档中的示例显示使用如下函数:

y_score = classifier.decision_function(X_test)    
precision_recall_curve(y_test, y_score)

在示例中,decision_functionSVM 分类器的内置函数。但是,我没有看到像随机森林分类器或线性回归那样的函数。

谁能帮我理解 y_score 和决策函数到底是什么,以及我如何为任何分类器计算它?

谢谢!

查看documentation of precision_recall_curve中的第二个参数说明:

probas_pred : array, shape = [n_samples]

Estimated probabilities or decision function.

decision_function() 不存在时,您可以使用 predict_proba() 代替它。

对于没有内置 decision_function 的所有其他分类器, 你应该使用 predict_proba 函数,它做的事情本质上是一样的。

y_score = random_forest.predict_proba()