是否可以在 mlr 中对 classification 任务进行子集化,同时保持 positive/negative class 比率不变?
Is it possible to subset a classification task in mlr keeping the positive/negative class ratio unchanged?
为了在 mlr 中对大型机器学习 class化任务进行小测试,我想先创建保持原始任务 positive/negative 比率的小任务。
目前我正在使用函数 subsetTask
手动执行此操作,将参数 subset
设置为保留 class 比率的固定索引向量。
有没有办法在内部做到这一点?类似于 "Take 75% of this task, preserving the class ratio"。也许使用重采样实例?
谢谢!
函数 downsample(my_task, perc=0.05, stratify=TRUE)
应该是您要查找的函数:
https://mlr.mlr-org.com/reference/downsample.html
将参数 stratify
设置为 TRUE(默认为 FALSE)保持原始数据的 class 比率。
有帮助吗?
为了在 mlr 中对大型机器学习 class化任务进行小测试,我想先创建保持原始任务 positive/negative 比率的小任务。
目前我正在使用函数 subsetTask
手动执行此操作,将参数 subset
设置为保留 class 比率的固定索引向量。
有没有办法在内部做到这一点?类似于 "Take 75% of this task, preserving the class ratio"。也许使用重采样实例?
谢谢!
函数 downsample(my_task, perc=0.05, stratify=TRUE)
应该是您要查找的函数:
https://mlr.mlr-org.com/reference/downsample.html
将参数 stratify
设置为 TRUE(默认为 FALSE)保持原始数据的 class 比率。
有帮助吗?