使用随机搜索测试数据的最佳预测器
Using the best predictor from Randomized search for test data
我使用 'RandomizedSearchCV'
函数来估计随机森林模型的最佳参数。我可以使用 'best_estimator_'
属性来预测我的测试数据吗?
我的问题是,在进行随机搜索时,部分数据会用于验证。那么最佳估计 RF 模型不会在整个数据集 rt 上进行训练?还是一切都在后台处理?
如文档中所写 cv.best_estimator_
returns 搜索选择的估算器,即给出最高分的估算器。
如果参数 refit
设置为 True(默认值),将使用包括验证在内的整个数据集上的最佳参数重新拟合模型。因此,您可以简单地使用 cv.best_estimator_
来预测您的测试数据。
我使用 'RandomizedSearchCV'
函数来估计随机森林模型的最佳参数。我可以使用 'best_estimator_'
属性来预测我的测试数据吗?
我的问题是,在进行随机搜索时,部分数据会用于验证。那么最佳估计 RF 模型不会在整个数据集 rt 上进行训练?还是一切都在后台处理?
如文档中所写 cv.best_estimator_
returns 搜索选择的估算器,即给出最高分的估算器。
如果参数 refit
设置为 True(默认值),将使用包括验证在内的整个数据集上的最佳参数重新拟合模型。因此,您可以简单地使用 cv.best_estimator_
来预测您的测试数据。