来自 Linux 终端的 Weka "select attributes"

Question

我有兴趣在系统中包含一些来自 Weka 的结果。我试图在 Rweka 和 python 中寻找类似的函数，但我不能，所以我认为运行从 Linux 终端中处理该过程可以解决我的问题。在“select 属性”面板中，我选择了：

属性评估器：CfsSubsetEval -P 1 -E 1 搜索方法：MultiObjectiveEvolutionarySearch -generations 20 -population-size 100 -seed 1 -algorithm 0 -report-frequency 20 -log-file /home/aurorax/Git_repos/postdoc/QoI/to_submit/weka-3-8-5

当我运行它时，它显示以下“代码”：

=== Run information ===

Evaluator:    weka.attributeSelection.CfsSubsetEval -P 1 -E 1
Search:       weka.attributeSelection.MultiObjectiveEvolutionarySearch -generations 20 -population-size 100 -seed 1 -algorithm 0 -report-frequency 20 -log-file /home/aurorax/Git_repos/postdoc/QoI/to_submit/weka-3-8-5
Relation:     metricsAndRMSE1-weka.filters.unsupervised.instance.RemoveDuplicates
Instances:    293
Attributes:   12
              qcomp
              qpla
              qout
              qoutMean
              qoutMedian
              qprob
              qrec
              qinvMean
              qinvMedian
              qBMEmean
              qBMEmedian
              rmse1
Evaluation mode:    evaluate on all training dat

最后，它显示了我感兴趣的内容，即应该 selected 的属性：

Selected attributes: 1,3,11 : 3
                     qcomp
                     qout
                     qBMEmedian

你能给我一些指导吗？我已经检查了一些文档，但找不到执行此操作的方法。

非常感谢！

Answer 1

是的，您可以从命令行运行求值器，尽管不常用。

您可以像这样查询评估者的帮助，例如，CfsSubsetEval:

java -cp weka.jar weka.attributeSelection.CfsSubsetEval -h

输出分为一般选项和特定于CfsSubsetEval 的选项。一般的有：

General options:

-h
    display this help
-i <name of input file>
    Sets training file.
-c <class index>
    Sets the class index for supervised attribute
    selection. Default=last column.
-s <class name>
    Sets search method for subset evaluators.
-x <number of folds>
    Perform a cross validation.
-n <random number seed>
    Use in conjunction with -x.

假设您的数据集位于 /your/dataset.arff 并且 class 属性是 last 属性，您将得到以下内容：

java -cp weka.jar weka.attributeSelection.CfsSubsetEval \
  -i /your/dataset.arff \
  -c last \
  -s "SEARCH_METHOD_CLASSNAME + OPTIONS" \
  [other CfsSubsetEval options]

为了确保正确加载所有包，您应该使用 weka.Run class 来启动您的属性选择。这给了我们：

java -cp weka.jar weka.Run \
  weka.attributeSelection.CfsSubsetEval \
  -i /your/dataset.arff \
  -c last \
  -s "SEARCH_METHOD_CLASSNAME + OPTIONS" \
  [other CfsSubsetEval options]

或者，在您的情况下：

java -cp weka.jar weka.Run \
  weka.attributeSelection.CfsSubsetEval \
  -i /your/dataset.arff \
  -c last \
  -s "weka.attributeSelection.MultiObjectiveEvolutionarySearch -generations 20 -population-size 100 -seed 1 -algorithm 0 -report-frequency 20 -log-file /home/aurorax/Git_repos/postdoc/QoI/to_submit/weka-3-8-5" \
  -P 1 -E 1

最后说明：注意正确转义双引号和反斜杠。如果您的搜索方法命令行应包含它们（不是在您发布的情况下），您需要使用反斜杠将它们转义。

例如：

weka.attributeSelection.FunkySearch -b "some option \"with nested bits\""

将更改为命令行的一部分：

...
-s "weka.attributeSelection.FunkySearch -b \"some option \"with nested bits\"\""
...

来自 Linux 终端的 Weka "select attributes"

Weka "select attributes" from Linux terminal

linux

terminal

attributes

selection

weka