使用随机搜索测试数据的最佳预测器

Using the best predictor from Randomized search for test data

我使用 'RandomizedSearchCV' 函数来估计随机森林模型的最佳参数。我可以使用 'best_estimator_' 属性来预测我的测试数据吗?

我的问题是,在进行随机搜索时,部分数据会用于验证。那么最佳估计 RF 模型不会在整个数据集 rt 上进行训练?还是一切都在后台处理?

如文档中所写 cv.best_estimator_ returns 搜索选择的估算器,即给出最高分的估算器。

如果参数 refit 设置为 True(默认值),将使用包括验证在内的整个数据集上的最佳参数重新拟合模型。因此,您可以简单地使用 cv.best_estimator_ 来预测您的测试数据。