有没有一种方法可以在不执行的情况下提取 spark 作业的 DAG?

is there a possible way to extract the DAG of spark job without execution?

是否可以在不执行或 运行 作业的情况下提取 DAG 及其所有组件(阶段和任务)?

我有一个想法:在一个动作发生之前,我提取与该动作相关的 RDD 的依赖关系,并从中创建 DAG。

如果我没理解错的话,rdd.toDebugString就是你要找的。