通过 RandomizedLogisticRegression 查找选定的特征

Find selected features by RandomizedLogisticRegression

我正在对 300K 样本和 19 个特征进行二元分类。 我在 scikit 中使用 RandomizedLogisticRegression() 进行特征选择。 我想知道如何找到 RandomizedLogisticRegression() 选择了哪些特征。

您应该使用 get_support 函数:

from sklearn.datasets import load_iris
from sklearn.linear_model import RandomizedLogisticRegression

iris = load_iris()
X, y = iris.data, iris.target

clf = RandomizedLogisticRegression()
clf.fit(X,y)
print clf.get_support()

#prints [False  True  True  True]

或者,您可以获得支持特征的索引:

print clf.get_support(indices=True)
#prints [1 2 3]