无法从 emr notebook 运行 pyspark 内核中的 s3 存储桶下载文件

Not able to Download file from s3 bucket inside emr notebook running with pyspark kernel

我已经创建了一个具有 spark 和其他一些工具的 emr 集群,但是当启动 emr notebook 并尝试访问 s3 存储桶文件时,我无法从 s3 下载文件,出现权限被拒绝的错误。所有默认角色都可以访问 s3。

权限被拒绝是在 emr 写入端,而不是 s3 读取端。尝试将其下载到 /tmp/ 位置