如何实现分类变量的特征选择?

How to implement feature selection for categorical variables?

我在 select 使用重要功能时遇到问题。数据集的特征是分类的和数值的。目标变量是 False 或 True。数据集的特征大约有 100 个,所以我需要删除一些与目标变量无关的特征。除了随机森林特征重要性之外,还可以使用哪种方法?我正在使用 Python。在 R 中,我可以使用 Boruta 包来 select 重要的功能。但我不知道如何在 Python.

中执行此操作

可以通过计算与假设相关的特征的P值来选择相关特征,勾选https://towardsdatascience.com/feature-selection-correlation-and-p-value-da8921bfb3cf