刷新 Azure 机器学习中的数据集

Refresh the dataset in Azure machine learning

我有一个实验 (exp) 在 azure 机器学习工作室中作为 Web 服务 (exp [Predictive Exp.]) 发布,这个实验使用的数据是由 R 使用 AzureML 包推送的

library(AzureML)

ws <- workspace(
  id = 'xxxxxxxxx',
  auth = 'xxxxxxxxxxx'
)

upload.dataset(data_for_azure, ws, "data_for_azure")

上面的方法有效,但假设我想更新数据集(相同的架构只是添加了更多行)

我厌倦了这个,但这不起作用:

delete.datasets(ws, "data_for_azure")

refresh(ws, what = c("everything", "data_for_azure", "exp", "exp [Predictive Exp.]")) 

我收到以下错误说明:

Error: AzureML returns error code:
HTTP status code : 409
Unable to delete dataset due to lingering dependants

我查看了文档,我知道简单的刷新是不可能的(同名),我看到的唯一选择是删除 Web 服务并重新执行所有操作

任何解决方案都会有很大帮助!

来自 R 文档。

The AzureML API does not support uploads for replacing datasets with new data by re-using a name. If you need to do this, first delete the dataset from the AzureML Studio interface, then upload a new version.

现在,我认为这特别适用于 R sdk,因为 Python SDK 和 AzureML Studio UI 允许您上传新数据集。将与 R 团队核实此事。

我建议使用新名称将其作为新数据集上传,然后用这个新数据集替换实验中的数据集。抱歉,这似乎有点绕,但我认为这是更简单的选择。

除非您想使用 AzureML Studio 上传新版本,在这种情况下,转到 +NEW,数据集,select 您的文件和 select 表示这是现有数据集的复选框.文件名应该相同。