EMR 的 EBS 存储

EBS storage for EMR

有人可以澄清在 EMR 集群(瞬态/按需集群)中拥有 EBS 卷的用例是什么吗?

在 EMR 中使用 EBS 卷有什么好处?因为随着 EMR 集群的终止,EBS 也将被删除。

我正计划将 EMR 集群设置为 运行 基于 spark 的 ETL 作业,请寻找一些输入。我可以选择 EMRFS/S3,但只是想知道为什么我们在 EMR 中有 EBS。

谢谢。

EMR 支持的部分 EC2 实例类型除了支持 EBS 之外没有任何存储(例如 c4 和 m4 系列)。在这种情况下,实例将需要 EBS 才能与 EMR 一起使用,除非您指定更大的卷,否则每个实例将附加 10 GB 的默认卷。

当然,如果您需要实例提供的额外存储空间,EBS 也可以与其他已经包含存储空间的实例类型一起使用。

有关 EMR 和 EBS 的详细信息,请参阅 https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-storage.html