带分组 K 折 cv 生成器的 sklearn 网格搜索
sklearn grid search with grouped K fold cv generator
我正在尝试使用随机搜索和分组的 k 折交叉验证生成器对 sklearn 中的参数进行网格搜索。以下作品:
skf=StratifiedKFold(n_splits=5,shuffle=True,random_state=0)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=skf,n_iter=10)
rs.fit(X,y)
这不是
gkf=GroupKFold(n_splits=5)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
rs.fit(X,y)
#ValueError: The groups parameter should not be None
如何指示 groups
参数?
这也不行
gkf=GroupKFold(n_splits=5)
fv = gkf.split(X, y, groups=groups)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
rs.fit(X,y)
#TypeError: object of type 'generator' has no len()
作为参考,这是通过
完成的
rs.fit(X,y,groups=groups)
对于
rs=sklearn.model_selection.RandomizedSearchCV(forest,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
我正在尝试使用随机搜索和分组的 k 折交叉验证生成器对 sklearn 中的参数进行网格搜索。以下作品:
skf=StratifiedKFold(n_splits=5,shuffle=True,random_state=0)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=skf,n_iter=10)
rs.fit(X,y)
这不是
gkf=GroupKFold(n_splits=5)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
rs.fit(X,y)
#ValueError: The groups parameter should not be None
如何指示 groups
参数?
这也不行
gkf=GroupKFold(n_splits=5)
fv = gkf.split(X, y, groups=groups)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
rs.fit(X,y)
#TypeError: object of type 'generator' has no len()
作为参考,这是通过
完成的rs.fit(X,y,groups=groups)
对于
rs=sklearn.model_selection.RandomizedSearchCV(forest,parameters,scoring='roc_auc',cv=gkf,n_iter=10)