在 R 中设置 SVM 分类的参数

Setting the parameters for SVM Classification in R

描述:

  1. 对于数据集,我想通过使用径向基函数 (RBF) 内核和 Weston, Watkins native multi-class.
  2. 来应用 SVM
  3. 必须调整 rbf 内核参数 sigma,我想使用 k-folds cross validation 来执行此操作。我考虑固定 C.

解法:

看来nice包可以用了mlr to do this! So, to tune the rbf parameter sigma using CV for MSVM classification, (using this tutorial)

#While C is fix = 3, define a range to search sigma over it. Search between [10^{-6}, 10^{6}]
num_ps = makeParamSet(
  makeDiscreteParam("C", values = 3),
  makeNumericParam("sigma", lower = -6, upper = 6, trafo = function(x) 10^x)
)
#Define the Grid search method
ctrl = makeTuneControlGrid()
#Apply the k-folds CV
rdesc = makeResampleDesc("CV", iters = 3L)

res = tuneParams("classif.ksvm", task = iris.task, resampling = rdesc,
  par.set = num_ps, control = ctrl)

问题:

对于这部分

res = tuneParams("classif.ksvm", task = iris.task, resampling = rdesc,
      par.set = num_ps, control = ctrl)

根据文档,通过使用集成学习器 classif.ksvm, I'm asking to apply the multiclass classification that is defined in the package ksvm

如何知道使用了哪种方法和内核类型?我的意思是,如何强制学习器 classif.ksvm 使用已经在 ksvm 中定义的分类类型 (kbb-svc) 和内核 (rbfdot)?

如果这不可能,那么如何定义一个符合我所有要求的新学习者?

您必须在学习器中设置固定参数。因此,您首先必须创建它:

library(mlr)
lrn = makeLearner("classif.ksvm", par.vals = list(C = 3, type = "kbb-svc", kernel = "rbfdot"))

然后您只需在 ParamSet 中定义要更改的参数

num_ps = makeParamSet(
  makeNumericParam("sigma", lower = -6, upper = 6, trafo = function(x) 10^x)
)

然后你就可以按照你的例子进行调整

ctrl = makeTuneControlGrid()
rdesc = makeResampleDesc("CV", iters = 3L)
res = tuneParams(lrn, task = iris.task, resampling = rdesc, par.set = num_ps, control = ctrl)