有多少and/orCfsSubsetEvaluator在做特征选择的时候,在交叉验证的每一步中选择特征的标准是什么?

How many and/or what criteria does CfsSubsetEvaluator use in selecting features in each step of cross-validation while doing feature selection?

我对 WEKA 很陌生,我有一个 111 cases109 attributes 的数据集。我在 WEKA 中使用功能选择选项卡,CfsSubsetEvalBestFirst search method 用于 feature selection。我正在使用 leave-one-out cross-validation.

那么,WEKA 在交叉验证的每一步中选择了多少特征,或者该方法选择的特征数量的停止标准是什么

谢谢,

果皮

CfsSubsetEval 算法正在搜索协同工作良好的特征子集(特征之间的相关性较低,与目标标签的相关性较高)。子集的分数称为优点(您可以在输出中看到它)。

BestFirst 搜索不允许您确定 select 的特征数量。但是,您可以使用其他方法,例如 GreedyStepWise 或使用 InformationGain/GainRatio 算法和 Ranker 并定义特征集的大小。

可用于影响集合大小的另一个选项是搜索方向(向前、向后...)。

祝你好运