如何从一个EMR集群读取s3数据到另一个EMR集群?

How to read s3 data from one EMR cluster to another EMR cluster?

我有两个 EMR 集群和一个在 S3 存储桶中有 CSV 文件的 EMR 集群。 现在,我有另一个 EMR 集群,必须从 EMR(s3) 存储桶中读取数据。

请找截图。

如何从另一个EMR s3 bucket中读取数据?输入源是用于读取 csv 文件的 S3 存储桶。在同一个 EMR 中,我可以从 s3 存储桶中读取数据。

请帮助我。

非常感谢您的提前帮助。

S3 是一个独立的亚马逊网络服务,S3 不依赖于任何 EMR 特定集群,您可以以相同的方式从任意数量的消费者(在本例中为 EMR)访问单个 S3 存储桶,只需确保 AWS IAM policies/permissions 是正确的。