分类器超参数之间的相关性

Correlation among Hyperparameters of Classifiers

我想知道两个不同分类器的超参数之间是否存在某种相关性。

例如:假设我们 运行 LogisticRegression 在具有最佳超参数的数据集上(通过 GridSearch 找到)并且想要 运行 另一个分类器,例如SVCSVM 分类器)在同一数据集上,但不是使用 GridSearch 查找所有超参数,我们是否可以修复一些值(或缩小范围以限制 space 的搜索 GridSearch) 的超参数?

作为实验,我使用了 scikit-learn 的分类器,例如 LogisticRegressionSVSLinearSVCSGDClassifierPerceptron对一些众所周知的数据集进行分类。在某些情况下,我能够凭经验看到一些相关性,但并非总是适用于所有数据集。

所以请帮我弄清楚这一点。

我认为您不能像这样将不同分类器的不同参数关联在一起。这主要是因为每个分类器的行为都不同,因为它有自己的方式来沿着自己的方程组调整数据。例如,以具有两个不同内核 rbfsigmoidSVC 为例。 rbf 可能完全适合数据,intercept parameter C 设置为 0.001,而 'sigmoidkernel over the same data may fit withC' 值为 0.00001。两个值也可以相等。但是,您永远不能肯定地说。当你这么说时:

In some cases, I am able to see some correlation empirically, but not always for all datasets.

这可能只是巧合。因为这完全取决于 和 分类器。你不能应用它 globally.Correlation 并不总是等于因果关系

您可以访问 this site 并亲眼看到,尽管不同的回归函数具有相同的参数 a,但它们的方程式却大不相同,因此在同一数据集上,您的 a.