分类器超参数之间的相关性
Correlation among Hyperparameters of Classifiers
我想知道两个不同分类器的超参数之间是否存在某种相关性。
例如:假设我们 运行 LogisticRegression
在具有最佳超参数的数据集上(通过 GridSearch
找到)并且想要 运行 另一个分类器,例如SVC
(SVM
分类器)在同一数据集上,但不是使用 GridSearch
查找所有超参数,我们是否可以修复一些值(或缩小范围以限制 space 的搜索 GridSearch
) 的超参数?
作为实验,我使用了 scikit-learn
的分类器,例如 LogisticRegression
、SVS
、LinearSVC
、SGDClassifier
和 Perceptron
对一些众所周知的数据集进行分类。在某些情况下,我能够凭经验看到一些相关性,但并非总是适用于所有数据集。
所以请帮我弄清楚这一点。
我认为您不能像这样将不同分类器的不同参数关联在一起。这主要是因为每个分类器的行为都不同,因为它有自己的方式来沿着自己的方程组调整数据。例如,以具有两个不同内核 rbf
和 sigmoid
的 SVC
为例。 rbf
可能完全适合数据,intercept parameter C
设置为 0.001,而 'sigmoidkernel over the same data may fit with
C' 值为 0.00001。两个值也可以相等。但是,您永远不能肯定地说。当你这么说时:
In some cases, I am able to see some correlation empirically, but not always for all datasets.
这可能只是巧合。因为这完全取决于 和 分类器。你不能应用它 globally.Correlation 并不总是等于因果关系
您可以访问 this site 并亲眼看到,尽管不同的回归函数具有相同的参数 a
,但它们的方程式却大不相同,因此在同一数据集上,您的 a
.
我想知道两个不同分类器的超参数之间是否存在某种相关性。
例如:假设我们 运行 LogisticRegression
在具有最佳超参数的数据集上(通过 GridSearch
找到)并且想要 运行 另一个分类器,例如SVC
(SVM
分类器)在同一数据集上,但不是使用 GridSearch
查找所有超参数,我们是否可以修复一些值(或缩小范围以限制 space 的搜索 GridSearch
) 的超参数?
作为实验,我使用了 scikit-learn
的分类器,例如 LogisticRegression
、SVS
、LinearSVC
、SGDClassifier
和 Perceptron
对一些众所周知的数据集进行分类。在某些情况下,我能够凭经验看到一些相关性,但并非总是适用于所有数据集。
所以请帮我弄清楚这一点。
我认为您不能像这样将不同分类器的不同参数关联在一起。这主要是因为每个分类器的行为都不同,因为它有自己的方式来沿着自己的方程组调整数据。例如,以具有两个不同内核 rbf
和 sigmoid
的 SVC
为例。 rbf
可能完全适合数据,intercept parameter C
设置为 0.001,而 'sigmoidkernel over the same data may fit with
C' 值为 0.00001。两个值也可以相等。但是,您永远不能肯定地说。当你这么说时:
In some cases, I am able to see some correlation empirically, but not always for all datasets.
这可能只是巧合。因为这完全取决于 和 分类器。你不能应用它 globally.Correlation 并不总是等于因果关系
您可以访问 this site 并亲眼看到,尽管不同的回归函数具有相同的参数 a
,但它们的方程式却大不相同,因此在同一数据集上,您的 a
.