Dataset.download() 中超时错误的解决方法

Workaround for timeout error in Dataset.download()

azureml-sdk 版本:1.0.85

下面的调用(如数据集中给出的 UI),我得到这个

ds_split = Dataset.get_by_name(workspace, name='ret- holdout-split')
ds_split.download(target_path=dir_outputs, overwrite=True)
UnexpectedError:
{'errorCode': 'Microsoft.DataPrep.ErrorCodes.Unknown', 'message':
    'The client could not finish the operation within specified timeout.',
    'errorData': {}}

存储在 blob 中的 FileDataset 1GB 腌制文件。 Here's a gist with the full traceback

今天上午再次尝试,成功了。让我们在 "transient error"

下归档

我在加载 sqlpool 数据集时也遇到了同样的问题(超时错误)。花了一些时间后,我发现了 SQL 查询中的问题,并通过优化 SQL 查询 解决了超时问题。(可能对某些人有用)