如何将 AWS 开放数据集下载到我的机器上?
How can I download an AWS open data set to my machine?
我想使用 AWS CLI 将公开可用的数据集下载到我的机器上,但由于 the Registry of Open Data 仅提供 Amazon 资源名称 (ARN) 和没有URL,我不知道怎么做。
例如,Therapeutically Applicable Research to Generate Effective Treatments (TARGET) 的 arn 是:
arn:aws:s3:::gdc-target-phs000218-2-open
因此,存储桶名称是
gdc-target-phs000218-2-open
要列出它:
aws s3 ls s3://gdc-target-phs000218-2-open
要复制到您的本地文件夹(大型数据集可能需要很长时间):
aws s3 sync s3://gdc-target-phs000218-2-open .
或
aws s3 cp s3://gdc-target-phs000218-2-open . --recursive
我想使用 AWS CLI 将公开可用的数据集下载到我的机器上,但由于 the Registry of Open Data 仅提供 Amazon 资源名称 (ARN) 和没有URL,我不知道怎么做。
例如,Therapeutically Applicable Research to Generate Effective Treatments (TARGET) 的 arn 是:
arn:aws:s3:::gdc-target-phs000218-2-open
因此,存储桶名称是
gdc-target-phs000218-2-open
要列出它:
aws s3 ls s3://gdc-target-phs000218-2-open
要复制到您的本地文件夹(大型数据集可能需要很长时间):
aws s3 sync s3://gdc-target-phs000218-2-open .
或
aws s3 cp s3://gdc-target-phs000218-2-open . --recursive