Python 中二进制分类器的值重要性
Values Importance for Binary Classifier in Python
我正在 Python 3.5
中创建二元分类器
所以特征数量 (x1..xn) 和目标值 y 就像这样:
x1 x2 x3 y
Monday 10 12 1
Tuesday 18 20 0
Monday 12 22 1
Wednesday 19 19 0
Thursday 10 11 1
Thursday 10 12 1
Friday 19 12 0
Friday 18 21 0
Friday 12 10 1
所以我做分类器没有问题(以及所有需要的步骤,如数据预处理、交叉验证和评估)。
我的问题 - 如何估计 y 变量是否有任何显着变化取决于星期几(周一至周五),第 x1 列?
我知道一些技术作为特征的重要性,但使用它们我只能理解什么确切的特征(x1、x2 或 x3)对预测器最有价值。
我如何理解目标变量的列(x1,星期几)中的不同值的重要性?
谢谢!
x1 列的值可以转换为其中包含二进制逻辑值 ([0;1]) 的列。然后可以应用特征重要性技术。
http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html
我正在 Python 3.5
中创建二元分类器所以特征数量 (x1..xn) 和目标值 y 就像这样:
x1 x2 x3 y
Monday 10 12 1
Tuesday 18 20 0
Monday 12 22 1
Wednesday 19 19 0
Thursday 10 11 1
Thursday 10 12 1
Friday 19 12 0
Friday 18 21 0
Friday 12 10 1
所以我做分类器没有问题(以及所有需要的步骤,如数据预处理、交叉验证和评估)。
我的问题 - 如何估计 y 变量是否有任何显着变化取决于星期几(周一至周五),第 x1 列?
我知道一些技术作为特征的重要性,但使用它们我只能理解什么确切的特征(x1、x2 或 x3)对预测器最有价值。
我如何理解目标变量的列(x1,星期几)中的不同值的重要性?
谢谢!
x1 列的值可以转换为其中包含二进制逻辑值 ([0;1]) 的列。然后可以应用特征重要性技术。
http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html