Azure 机器学习:从 YAML 创建 ML 管道失败:TabularDataset 不支持挂载。只有 FileDataset 支持挂载
Azure Machine Learning: Creating ML Pipeline from YAML fails: TabularDataset does not support mount. Only FileDataset supports mount
我是 Azure 机器学习的新手,正在尝试创建一个简单的 ML 管道。 AzureML 支持 YAML 来定义 ML 管道,这里有描述(https://docs.microsoft.com/en-us/azure/machine-learning/reference-pipeline-yaml)。
我遇到的一个错误是,当我使用 YAML 文件从“az ml pipeline create”创建管道时,它 returns 下面的消息,即使我为 bind_mode 指定了“下载” data_references.
Messeage: "<class azureml.data.tabular_dataset.TabularDataset'> does not support mount. Only FileDataset supports mount"
环境:
OS: Windows 10
Azure CLI:2.11.1
表格数据集的 bind_mode 似乎无法正常工作,或者我错过了什么。我感到困惑的原因是,正如您在上面 link 中描述的示例 yaml 文件中所见,带有“bind_mode: 下载”的数据集应该可以工作。
下面是 YAML 示例,其中定义了一个名为“dataset1”的表格格式数据集。
示例 YAML:
pipeline:
name: "Sample ML pipeline YAML"
data_references:
sampleDS:
dataset_name: dataset1
bind_mode: download
default_compute: compute-name
steps:
SampleStep:
type: PythonScriptStep
name: SampleProcessing
script_name: processing.py
allow_reuse: True
source_directory: ".\src\pipeline\steps"
inputs:
input_ds:
source: sampleDS
当data_references更改为以下内容时(直接在数据存储中指定路径,而不是通过注册的数据集),它有效。
name: "Sample ML pipeline YAML"
data_references:
sampleDS:
datastore: workspaceblobstore
path_on_datastore: path/of/sampeDS/sample.csv
Yes.You 是对的。 TabularDataset 不支持下载或装载。您可以创建并注册一个文件数据集,代码示例将起作用。
详细了解数据集类型 here
我是 Azure 机器学习的新手,正在尝试创建一个简单的 ML 管道。 AzureML 支持 YAML 来定义 ML 管道,这里有描述(https://docs.microsoft.com/en-us/azure/machine-learning/reference-pipeline-yaml)。
我遇到的一个错误是,当我使用 YAML 文件从“az ml pipeline create”创建管道时,它 returns 下面的消息,即使我为 bind_mode 指定了“下载” data_references.
Messeage: "<class azureml.data.tabular_dataset.TabularDataset'> does not support mount. Only FileDataset supports mount"
环境:
OS: Windows 10
Azure CLI:2.11.1
表格数据集的 bind_mode 似乎无法正常工作,或者我错过了什么。我感到困惑的原因是,正如您在上面 link 中描述的示例 yaml 文件中所见,带有“bind_mode: 下载”的数据集应该可以工作。
下面是 YAML 示例,其中定义了一个名为“dataset1”的表格格式数据集。
示例 YAML:
pipeline:
name: "Sample ML pipeline YAML"
data_references:
sampleDS:
dataset_name: dataset1
bind_mode: download
default_compute: compute-name
steps:
SampleStep:
type: PythonScriptStep
name: SampleProcessing
script_name: processing.py
allow_reuse: True
source_directory: ".\src\pipeline\steps"
inputs:
input_ds:
source: sampleDS
当data_references更改为以下内容时(直接在数据存储中指定路径,而不是通过注册的数据集),它有效。
name: "Sample ML pipeline YAML"
data_references:
sampleDS:
datastore: workspaceblobstore
path_on_datastore: path/of/sampeDS/sample.csv
Yes.You 是对的。 TabularDataset 不支持下载或装载。您可以创建并注册一个文件数据集,代码示例将起作用。 详细了解数据集类型 here