mlr 中可重复使用的保留

reusable holdout in mlr

如何更改 mlr 中的交叉验证或 holdout 程序,以便在使用验证集进行测试之前,根据程序更改同一验证集,即可重复使用的 holdout 程序?

程序: http://insilico.utulsa.edu/wp-content/uploads/2016/10/Dwork_2015_Science.pdf

简答:mlr 不支持。

长答案:我在机器学习差分隐私方面的经验是,在实践中它并不像宣传的那样有效。特别是,要应用 thresholdout,您需要 a) 大量数据和 b) 给定分类器对给定数据过度拟合的先验概率——这在实践中您无法轻易确定。虽然您引用的论文附带的示例代码表明 thresholdout 在这种特定情况下有效,但代码中添加的噪声量看起来像是临时确定的;与论文中描述的thresholdout算法的关系不清楚。

在差分隐私能够在这种场景中得到稳健应用之前,mlr 不会支持它。