AWS EMR 上的 ClusterID 与 JobFlowID

ClusterID vs JobFlowID on AWS EMR

我对可用的 API 和两个标识符有点困惑。 我正在使用 boto,但不要认为这是这里的问题:我的问题涉及任何 api(但不是 cli)。

我使用 RunJobFlow 启动 JobFlow,returns 我使用 JobFlowId。假设我不想保留该数字,而是稍后查找 JobFlow 是什么 运行 向它们添加步骤。

我认为我应该能够使用 DescribeJobFlows 找到所有 jobflow_ids 并从那里继续。但是在文档 (http://docs.aws.amazon.com/ElasticMapReduce/latest/API/API_DescribeJobFlows.html) 中,这个 api 调用被标记为已弃用,并指导我们使用 ListClusters,它 returns cluster_ids.

是什么将两者联系在一起?它是相同的标识符吗?如果不是,我如何从集群 ID 中获取作业流 ID?

我认为混淆也来自于这样一个事实,即在 cli 上命令是 "create-cluster" 而 returns 是 cluster_id,并且添加步骤也需要 cluster_id..

集群id和作业流id是一样的(j-######)。集群 ID 是一个更适合其用途的名称,以免与 Hadoop 中的作业术语混淆。所以继续使用 ListClusters (http://docs.aws.amazon.com/ElasticMapReduce/latest/API/API_ListClusters.html)。