如何调整 Azure AutoML 中的特征重要性

How to adjust feature importance in Azure AutoML

我希望有一些使用 Azure AutoML 的低代码模型,这实际上只是转到 AutoML 选项卡,运行 对我的数据集进行分类实验,完成后,我部署了最佳选择模型。

这个模型有点管用(意思是,我发布了端点,然后我做了一些手动验证,看起来很准确),但是,我不够自信,因为当我查看解释时,我可以看到类似这个:

4 个最重要的特征并不是很重要。最“重要”的实际上不是我喜欢使用的那个。我希望它能更多地使用 Title 功能。

有没有这样的东西我可以调整个别特征的重要性,比如在开始实验之前对所有特征进行排名?

我很想多读书,但我只找到了这个:

Increase feature importance

唯一的答案似乎是关于如何衡量一个特征是否重要。

因此,这是否意味着,如果我想自定义实验,例如选择要“关注”的功能,我应该学习如何使用 Azure ML 中的“设计器”部分?或者这是我做不到的事情,即使是设计师。我想我的困惑是,ML 是一个如此大的话题,我正在寻找一个学习方向,在这种情况下,我所拥有的,这样我就可以改进我当前的模型。

这是link功能定制文档。

使用 SDK,您可以在 AutoMLConfig object. Learn more about enabling featurization.

中指定“美化”:'auto' / 'off' / 'FeaturizationConfig'

自动 ML 尝试不同的 ML 模型,这些模型具有不同的设置来控制过度拟合。自动化 ML 将根据从保留数据中获得的最佳分数(例如准确性)来选择最佳的过拟合参数配置。这些模型的过度拟合设置包括:

  • 在 ML 模型正在优化的损失函数中明确惩罚过于复杂的模型
  • 训练前限制模型的复杂性,例如通过限制集成树学习模型(例如梯度提升树或随机森林)中树的大小

https://docs.microsoft.com/en-us/azure/machine-learning/concept-manage-ml-pitfalls