如何使用 java jar 访问 EMR 上的本地文件?

How to access local files on EMR using java jar?

是否可以将文件从 s3 复制到 EMR 本地存储并通过 java jar 访问它?如果是,我们如何知道它复制了哪个 EMR 节点的文件? (这是必需的,因为 java jar 需要和文件放在同一个盒子里?)

你试过SCP客户端吗?您可以执行如下操作将文件从 s3 复制到 EMR 主节点:

aws s3 cp s3://yourBucket/folder/object ./
scp -i yourKey.pem ./object hadoop@ec2-xx-xx-xx-xx.us-west-2.compute.amazonaws.com:/pathToWhereYouWantToStoreFileOnEMRLocal/

或者,您可以通过 SSH 连接到 EMR 集群的主节点,然后使用 AWS CLI 命令将文件从 S3 复制到本地文件系统。