重构 Azure 机器学习中的列和功能

Refactor columns and features in Azure Machine Learning

有什么方法可以使我在 Azure ML 中的数据集功能变成不同于现有功能的东西吗?

我在样本数据集中找到了泰坦尼克号船的数据集,我想使用它,但我的所有列都是数字特征或字符串特征,但我想对它们进行分类。还有可能重命名我模型中的列,使其比我最初得到的更具描述性吗?例如,我不知道 SibSp 是什么意思。

我认为“编辑元数据”模块可以满足您在这里的大部分需求。查看 https://msdn.microsoft.com/en-us/library/azure/dn905986.aspx 上的文档了解详细信息。

jmp

您所做的实际上是重新创建 Raja Iqbal 为泰坦尼克号数据集所做的实验。我建议您在这里查看:http://gallery.cortanaintelligence.com/Experiment/Tutorial-Building-a-classification-model-in-Azure-ML-8?share=1

为了回答您的问题,您可以将模块拖到 canvas 以便将功能分类;是编辑元数据模块,您可以在其中 select 您想要的列,并将 Categorical-properties 窗格中的“未更改”更改为“分类”,如下图所示:

您还可以使用相同的模块为您的列指定不同的列名称,从而更好地理解它们。 SibSp 表示 SiblingSpouse,就像我在下图中将其重命名为:

最后可以给目标值赋值(survived),把字段做成标签方便使用