如何 run/re-run 作业子集 AWS Glue 工作流程?

How to run/re-run subset of jobs AWS Glue workflow?

我正在构建一个 AWS Glue 工作流程,该工作流程由 运行 长期作业组成,其中许多作业可能会失败。有什么方法可以在失败后重新 运行 工作流程中的特定分支?

例如,我的工作流程如下所示:

<Start Trigger> -> [Job 1] -> [Job 2] -> [Job 4]
       ↳ [Job 4]

假设 [Job 1][Job 4] 各花费 3 小时并且都成功完成。然后 [Job 2] 被触发但失败了,使我的工作流处于这种状态:

<Start Trigger> -> [Job 1 ✔] -> [Job 2 ✗] -> [Job 4]
       ↳ [Job 4 ✔]

我做了一个更改,修复了 [Job 2],并且相信在重新 运行 时它会 运行 成功。我希望能够仅重新运行 工作流的 [Job 2] -> [Job 4] 分支,因为所有其他父作业都已成功完成。

这是否可以在 AWS Glue 中完成?我正在考虑尝试构建一个 AWS Step Functions workflow of glue jobs as Step Functions workflows seem to have this functionality.

自 2020 年 8 月起,现在可以执行此操作。

https://docs.aws.amazon.com/glue/latest/dg/resuming-workflow.html