使用 R 在 Azure ML Jupyter/iPython Notebook 中下载自定义数据集
Download a custom dataset in Azure ML Jupyter/iPython Notebook using R
我需要在 Azure Jupyter/iPython Notebook 中下载自定义数据集。
我的最终目标是安装 R 包。为了能够做到这一点,需要以代码形式下载包(数据集)。我遵循了 Andrie de Vries 在 post 的评论部分概述的步骤:Jupyter Notebooks with R in Azure ML Studio.
将包作为 ZIP 文件上传没有问题,但是当我 运行 我的笔记本中的代码出现错误时:
Error in curl(x$DownloadLocation, handle = h, open = conn): Failure
when receiving data from the peer Traceback:
- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
- lapply(1:nrow(datasets), function(j) get_dataset(datasets[j, . ], ...))
- FUN(1L[[1L]], ...)
- get_dataset(datasets[j, ], ...)
- curl(x$DownloadLocation, handle = h, open = conn)
所以我将代码简化为:
library("AzureML")
ws <- workspace()
ds <- datasets(ws)
ds$Name
data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
head(data)
其中 "plotly_3.6.0.tar.gz.zip" 是我的数据类型 "Zip" 的数据集的名称。
不幸的是,这会导致同样的错误。
为了排除数据类型问题,我还尝试下载了另一个数据类型为 "Dataset" 的数据集。同样的错误。
现在我将要下载的数据集更改为 AzureML Studio 的示例数据集之一。
"text.preprocessing.zip" 的数据类型为 Zip
data <- download.datasets(ws, "text.preprocessing.zip")
"Flight Delays Data" 的数据类型为 GenericCSV
data <- download.datasets(ws, "Flight Delays Data")
两个示例数据集都可以毫无问题地下载。
为什么我不能下载自己保存的数据集?
我在 download.datasets 函数的文档中找不到任何有用的信息。不在 rdocumentation.org, nor on cran.r-project.org (page 17-18).
试试这个:
library(AzureML)
ws <- workspace(
id = "your AzureML ID",
auth = "your AzureML Key"
)
name <- "Name of your saved data"
ws <- workspace()
我得到的错误似乎是由于(当时较早的)Azure ML Studio 中的一个错误。
我在 回复后再次尝试,结果发现我的代码按预期工作,没有任何更改。不需要添加 id
和 auth
参数。
我需要在 Azure Jupyter/iPython Notebook 中下载自定义数据集。 我的最终目标是安装 R 包。为了能够做到这一点,需要以代码形式下载包(数据集)。我遵循了 Andrie de Vries 在 post 的评论部分概述的步骤:Jupyter Notebooks with R in Azure ML Studio.
将包作为 ZIP 文件上传没有问题,但是当我 运行 我的笔记本中的代码出现错误时:
Error in curl(x$DownloadLocation, handle = h, open = conn): Failure when receiving data from the peer Traceback:
- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
- lapply(1:nrow(datasets), function(j) get_dataset(datasets[j, . ], ...))
- FUN(1L[[1L]], ...)
- get_dataset(datasets[j, ], ...)
- curl(x$DownloadLocation, handle = h, open = conn)
所以我将代码简化为:
library("AzureML")
ws <- workspace()
ds <- datasets(ws)
ds$Name
data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
head(data)
其中 "plotly_3.6.0.tar.gz.zip" 是我的数据类型 "Zip" 的数据集的名称。 不幸的是,这会导致同样的错误。 为了排除数据类型问题,我还尝试下载了另一个数据类型为 "Dataset" 的数据集。同样的错误。
现在我将要下载的数据集更改为 AzureML Studio 的示例数据集之一。 "text.preprocessing.zip" 的数据类型为 Zip
data <- download.datasets(ws, "text.preprocessing.zip")
"Flight Delays Data" 的数据类型为 GenericCSV
data <- download.datasets(ws, "Flight Delays Data")
两个示例数据集都可以毫无问题地下载。
为什么我不能下载自己保存的数据集?
我在 download.datasets 函数的文档中找不到任何有用的信息。不在 rdocumentation.org, nor on cran.r-project.org (page 17-18).
试试这个:
library(AzureML)
ws <- workspace(
id = "your AzureML ID",
auth = "your AzureML Key"
)
name <- "Name of your saved data"
ws <- workspace()
我得到的错误似乎是由于(当时较早的)Azure ML Studio 中的一个错误。
我在 id
和 auth
参数。