如何将 AWS 开放数据集下载到我的机器上?

How can I download an AWS open data set to my machine?

我想使用 AWS CLI 将公开可用的数据集下载到我的机器上,但由于 the Registry of Open Data 仅提供 Amazon 资源名称 (ARN) 和没有URL,我不知道怎么做。

例如,Therapeutically Applicable Research to Generate Effective Treatments (TARGET) 的 arn 是:

arn:aws:s3:::gdc-target-phs000218-2-open

因此,存储桶名称

gdc-target-phs000218-2-open

列出它:

aws s3 ls s3://gdc-target-phs000218-2-open

复制到您的本地文件夹(大型数据集可能需要很长时间):

aws s3 sync s3://gdc-target-phs000218-2-open .

aws s3 cp s3://gdc-target-phs000218-2-open . --recursive