使用 ROC 曲线选择变量时是否应该尝试多个不同的种子值?

Should I try multiple different seed values when using a ROC curve to choose variables?

假设我有两个变量子集,集合 A 和集合 B。集合 A 产生的 ROC 曲线比集合 B 好得多,但是,我刚刚意识到使用不同的种子时 ROC 曲线会发生变化。集合 A 总是会产生比集合 B 更好的 ROC 曲线,还是我应该使用不同的种子值为每个集合生成多条 ROC 曲线来比较变量的子集?

在许多情况下,种子之间的差异可以忽略不计。如果您需要比较算法在不同数据集上的表现,您肯定需要使用相同的种子