使用 R 在 Azure ML Jupyter/iPython Notebook 中下载自定义数据集

Download a custom dataset in Azure ML Jupyter/iPython Notebook using R

我需要在 Azure Jupyter/iPython Notebook 中下载自定义数据集。 我的最终目标是安装 R 包。为了能够做到这一点,需要以代码形式下载包(数据集)。我遵循了 Andrie de Vries 在 post 的评论部分概述的步骤:Jupyter Notebooks with R in Azure ML Studio.

将包作为 ZIP 文件上传没有问题,但是当我 运行 我的笔记本中的代码出现错误时:

Error in curl(x$DownloadLocation, handle = h, open = conn): Failure when receiving data from the peer Traceback:

  1. download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
  2. lapply(1:nrow(datasets), function(j) get_dataset(datasets[j, . ], ...))
  3. FUN(1L[[1L]], ...)
  4. get_dataset(datasets[j, ], ...)
  5. curl(x$DownloadLocation, handle = h, open = conn)

所以我将代码简化为:

library("AzureML")
ws <- workspace()
ds <- datasets(ws)
ds$Name

data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
head(data)

其中 "plotly_3.6.0.tar.gz.zip" 是我的数据类型 "Zip" 的数据集的名称。 不幸的是,这会导致同样的错误。 为了排除数据类型问题,我还尝试下载了另一个数据类型为 "Dataset" 的数据集。同样的错误。

现在我将要下载的数据集更改为 AzureML Studio 的示例数据集之一。 "text.preprocessing.zip" 的数据类型为 Zip

data <- download.datasets(ws, "text.preprocessing.zip")

"Flight Delays Data" 的数据类型为 GenericCSV

data <- download.datasets(ws, "Flight Delays Data")

两个示例数据集都可以毫无问题地下载。

为什么我不能下载自己保存的数据集?

我在 download.datasets 函数的文档中找不到任何有用的信息。不在 rdocumentation.org, nor on cran.r-project.org (page 17-18).

试试这个:

library(AzureML)
ws <- workspace(
id = "your AzureML ID",
auth = "your AzureML Key"
)
name <- "Name of your saved data"
ws <- workspace()

我得到的错误似乎是由于(当时较早的)Azure ML Studio 中的一个错误。

我在 回复后再次尝试,结果发现我的代码按预期工作,没有任何更改。不需要添加 idauth 参数。