hidden_layer_sizes 的 GridSearchCV 的奇怪行为

Question

GridSearchCV（无论是来自 sklearn 还是来自 dask）似乎参数有些奇怪或错误导致 MLPRegressor 忽略参数。
我用一个最小的工作示例来展示行为。
在我的例子中假设数值初始化 features 和 values

print(features.shape)
print(values.shape)
(321278, 36)
(321278,)

和运行下面的代码

from dask_ml.model_selection import GridSearchCV as daskGridSearchCV
from sklearn.model_selection import GridSearchCV as skGridSearchCV
from sklearn.neural_network import MLPRegressor
myparams = {'hidden_layer_sizes': [(2, ), (4, )]}
daskgridCV = daskGridSearchCV(estimator=MLPRegressor(), n_jobs=-1, param_grid=myparams)
daskbestfit = daskgridCV.fit(features, values)
skgridCV = skGridSearchCV(estimator=MLPRegressor(), n_jobs=-1, param_grid=myparams,cv=3)
skbestfit = skgridCV.fit(features, values)
display(daskbestfit)
display(skbestfit)

结果

GridSearchCV(cache_cv=True, cv=None, error_score='raise',
             estimator=MLPRegressor(activation='relu', alpha=0.0001,
                                    batch_size='auto', beta_1=0.9, beta_2=0.999,
                                    early_stopping=False, epsilon=1e-08,
                                    hidden_layer_sizes=(100,),
                                    learning_rate='constant',
                                    learning_rate_init=0.001, max_iter=200,
                                    momentum=0.9, n_iter_no_change=10,
                                    nesterovs_momentum=True, power_t=0.5,
                                    random_state=None, shuffle=True,
                                    solver='adam', tol=0.0001,
                                    validation_fraction=0.1, verbose=False,
                                    warm_start=False),
             iid=True, n_jobs=-1,
             param_grid={'hidden_layer_sizes': [(2,), (4,)]}, refit=True,
             return_train_score=False, scheduler=None, scoring=None)
GridSearchCV(cv=3, error_score='raise-deprecating',
             estimator=MLPRegressor(activation='relu', alpha=0.0001,
                                    batch_size='auto', beta_1=0.9, beta_2=0.999,
                                    early_stopping=False, epsilon=1e-08,
                                    hidden_layer_sizes=(100,),
                                    learning_rate='constant',
                                    learning_rate_init=0.001, max_iter=200,
                                    momentum=0.9, n_iter_no_change=10,
                                    nesterovs_momentum=True, power_t=0.5,
                                    random_state=None, shuffle=True,
                                    solver='adam', tol=0.0001,
                                    validation_fraction=0.1, verbose=False,
                                    warm_start=False),
             iid='warn', n_jobs=-1,
             param_grid={'hidden_layer_sizes': [(2,), (4,)]},
             pre_dispatch='2*n_jobs', refit=True, return_train_score=False,
             scoring=None, verbose=0)

因此在这两种情况下，hidden_layer_sizes 参数的值 (100,) 不在网格中。是我做错了什么，还是这里发生了什么？

python-版本 3.6.9
sklearn-版本 0.21.2
dask_ml-Version1.0.0

Answer 1

这是绝对正常的。 estimator=MLPRegressor()创建MLPRegressor with it's default values, when initializing GridSearchCV的实例（(100,)是hidden_layer_sizes参数的默认值.)

通过用数据拟合 GridSearchCV，它会为每个 Fold 遍历 myparams 中每个可能的超参数组合，并选择最好的一个。您可以通过访问 skgridCV.cv_results_ .

检查交叉验证的结果

Answer 2

答案是简单地在网格参数中添加另一个您想要的参数 hidden_layers。

谢谢

这里有一个例子：

parameters = {
  'learning_rate': ['constant','adaptive'],
  'solver': ['lbfgs','adam'],
  'tol' : 10.0 ** -np.arange(1, 6),
  'verbose' : [True],
  'early_stopping': [True],
  'activation' : ['tanh','logistic'],
  'learning_rate_init': 10.0 ** -np.arange(1, 6),
  'max_iter': [5000],
  'alpha': (.0001, .0002, .0003, .0004, .00005, .00006), **'hidden_layer_sizes'**:(np.arange(1,2)),
  'random_state':np.arange(1, 4)
}

hidden_layer_sizes 的 GridSearchCV 的奇怪行为

Strange behaviour of GridSearchCV with hidden_layer_sizes

python

scikit-learn

grid-search

python-3.6

dask-ml