Pipeline 对象是否存储它训练的数据的分数?
Does a Pipeline object store the score of the data it trained with?
我想知道 Pipeline 对象中保存的模型是否包含训练数据的分数。如果是这样,如何在不必将数据放回原处的情况下获得该分数?
这取决于型号。大多数情况下,没有。另外,您需要指定“分数”的确切含义;有许多指标可能保存在某处。
kNN
模型将训练数据存储在私有属性 _fit_X
(source) 中,因此您可以从中重新创建一个分数(尽管您并没有真正节省很多工作在这里)。
HistGradientBoosting
模型存储 iteration-wise 训练和验证分数 (docs)。 GradientBoosting
模型在每次迭代时类似地保存损失函数。
Cross-validation 模型如 LogisticRegressionCV
保存每个超参数值的 cross-validation 分数。不过,这些与训练分数有很大不同。
我想知道 Pipeline 对象中保存的模型是否包含训练数据的分数。如果是这样,如何在不必将数据放回原处的情况下获得该分数?
这取决于型号。大多数情况下,没有。另外,您需要指定“分数”的确切含义;有许多指标可能保存在某处。
kNN
模型将训练数据存储在私有属性 _fit_X
(source) 中,因此您可以从中重新创建一个分数(尽管您并没有真正节省很多工作在这里)。
HistGradientBoosting
模型存储 iteration-wise 训练和验证分数 (docs)。 GradientBoosting
模型在每次迭代时类似地保存损失函数。
Cross-validation 模型如 LogisticRegressionCV
保存每个超参数值的 cross-validation 分数。不过,这些与训练分数有很大不同。