在 EMR 上禁用分段上传

Disable multipart upload on EMR

目标是在 Amazon EMR 上禁用分段上传。

guide 表示在创建 EMR 集群时在 编辑软件设置 中输入 classification=core-site,properties=[fs.s3.multipart.uploads.enabled=false]

我的问题是:

  1. 我们可以修改 现有 EMR 集群的配置吗?如果可以,怎么做?
  2. 我们可以通过将sparkSession.sparkContext.hadoopConfiguration.set("fs.s3.multipart.uploads.enabled","false")放入要在EMR上执行的jar中来实现相同的目标吗?

遗憾的是,您当前无法修改 运行 EMR 集群上的配置,但如果您可以启动一个新集群,则可以使用 AWS EMR 控制台克隆当前集群的配置,然后修改启动前的配置。 (注意:仅克隆配置,不克隆任何可能存储在 HDFS 或集群实例本地磁盘上的数据。)

但是,我相信您在第二个问题中提出的问题会按预期工作。您是否尝试过并发现它不起作用?