mlr pipeops 中的调试/检查步骤

Debugging / checking steps in mlr pipeops

我想检查计算中的中间步骤,但我不知道该怎么做。

书中的例子:

mutate = mlr_pipeops$get("mutate")
filter = mlr_pipeops$get("filter",
  filter = mlr3filters::FilterVariance$new(),
  param_vals = list(filter.frac = 0.5))

graph = mutate %>>%
  filter %>>%
  mlr_pipeops$get("learner",
    learner = mlr_learners$get("classif.rpart"))

graph$keep_results=TRUE

task = mlr_tasks$get("iris")
graph$train(task)

现在,我想查看任务的转换数据矩阵(在 mutatefilter 之后)。这一定在 graph 中的某个地方,尤其是当我设置 keep_results=TRUE 时。但我看不到在哪里。有人可以帮我吗?

设置keep_results=TRUE是正确的开始。当您设置它时,每个 PipeOp 的计算结果将存储在 PipeOp$.result 槽中。结果是一个列表,因为 PipeOp 可以有多个结果对象,但对于大多数预处理操作,它只有一个成员 ($output),并且只是一个可以检查的 Task

# your code
graph$train(task)
#> $classif.rpart.output
#> NULL
#>

# E.g. the result of the "variance" filter:

graph$pipeops$variance$.result
#> $output
#> <TaskClassif:iris> (150 x 3)
#> * Target: Species
#> * Properties: multiclass
#> * Features (2):
#>   - dbl (2): Petal.Length, Sepal.Length

# $output is a Task, so the data can e.g. be seen with $data():

graph$pipeops$variance$.result$output$data()
#>        Species Petal.Length Sepal.Length
#>   1:    setosa          1.4          5.1
#>   2:    setosa          1.4          4.9
#>   3:    setosa          1.3          4.7
#>   4:    setosa          1.5          4.6
#>   5:    setosa          1.4          5.0
#>  ---                                    
#> 146: virginica          5.2          6.7
#> 147: virginica          5.0          6.3
#> 148: virginica          5.2          6.5
#> 149: virginica          5.4          6.2
#> 150: virginica          5.1          5.9