是否可以在 mlr 中对 classification 任务进行子集化,同时保持 positive/negative class 比率不变?

Is it possible to subset a classification task in mlr keeping the positive/negative class ratio unchanged?

为了在 mlr 中对大型机器学习 class化任务进行小测试,我想先创建保持原始任务 positive/negative 比率的小任务。

目前我正在使用函数 subsetTask 手动执行此操作,将参数 subset 设置为保留 class 比率的固定索引向量。

有没有办法在内部做到这一点?类似于 "Take 75% of this task, preserving the class ratio"。也许使用重采样实例?

谢谢!

函数 downsample(my_task, perc=0.05, stratify=TRUE) 应该是您要查找的函数:

https://mlr.mlr-org.com/reference/downsample.html

将参数 stratify 设置为 TRUE(默认为 FALSE)保持原始数据的 class 比率。

有帮助吗?