Pipeline 对象是否存储它训练的数据的分数?

Does a Pipeline object store the score of the data it trained with?

我想知道 Pipeline 对象中保存的模型是否包含训练数据的分数。如果是这样,如何在不必将数据放回原处的情况下获得该分数?

这取决于型号。大多数情况下,没有。另外,您需要指定“分数”的确切含义;有许多指标可能保存在某处。

kNN 模型将训练数据存储在私有属性 _fit_X (source) 中,因此您可以从中重新创建一个分数(尽管您并没有真正节省很多工作在这里)。

HistGradientBoosting 模型存储 iteration-wise 训练和验证分数 (docs)。 GradientBoosting 模型在每次迭代时类似地保存损失函数。

Cross-validation 模型如 LogisticRegressionCV 保存每个超参数值的 cross-validation 分数。不过,这些与训练分数有很大不同。