有多少and/orCfsSubsetEvaluator在做特征选择的时候,在交叉验证的每一步中选择特征的标准是什么?
How many and/or what criteria does CfsSubsetEvaluator use in selecting features in each step of cross-validation while doing feature selection?
我对 WEKA
很陌生,我有一个 111 cases
和 109 attributes
的数据集。我在 WEKA 中使用功能选择选项卡,CfsSubsetEval
和 BestFirst search method
用于 feature selection
。我正在使用 leave-one-out cross-validation
.
那么,WEKA 在交叉验证的每一步中选择了多少特征,或者该方法选择的特征数量的停止标准是什么
谢谢,
果皮
CfsSubsetEval
算法正在搜索协同工作良好的特征子集(特征之间的相关性较低,与目标标签的相关性较高)。子集的分数称为优点(您可以在输出中看到它)。
BestFirst
搜索不允许您确定 select 的特征数量。但是,您可以使用其他方法,例如 GreedyStepWise
或使用 InformationGain
/GainRatio
算法和 Ranker
并定义特征集的大小。
可用于影响集合大小的另一个选项是搜索方向(向前、向后...)。
祝你好运
我对 WEKA
很陌生,我有一个 111 cases
和 109 attributes
的数据集。我在 WEKA 中使用功能选择选项卡,CfsSubsetEval
和 BestFirst search method
用于 feature selection
。我正在使用 leave-one-out cross-validation
.
那么,WEKA 在交叉验证的每一步中选择了多少特征,或者该方法选择的特征数量的停止标准是什么
谢谢,
果皮
CfsSubsetEval
算法正在搜索协同工作良好的特征子集(特征之间的相关性较低,与目标标签的相关性较高)。子集的分数称为优点(您可以在输出中看到它)。
BestFirst
搜索不允许您确定 select 的特征数量。但是,您可以使用其他方法,例如 GreedyStepWise
或使用 InformationGain
/GainRatio
算法和 Ranker
并定义特征集的大小。
可用于影响集合大小的另一个选项是搜索方向(向前、向后...)。
祝你好运