如何 run/re-run 作业子集 AWS Glue 工作流程?
How to run/re-run subset of jobs AWS Glue workflow?
我正在构建一个 AWS Glue 工作流程,该工作流程由 运行 长期作业组成,其中许多作业可能会失败。有什么方法可以在失败后重新 运行 工作流程中的特定分支?
例如,我的工作流程如下所示:
<Start Trigger> -> [Job 1] -> [Job 2] -> [Job 4]
↳ [Job 4]
假设 [Job 1]
和 [Job 4]
各花费 3 小时并且都成功完成。然后 [Job 2]
被触发但失败了,使我的工作流处于这种状态:
<Start Trigger> -> [Job 1 ✔] -> [Job 2 ✗] -> [Job 4]
↳ [Job 4 ✔]
我做了一个更改,修复了 [Job 2]
,并且相信在重新 运行 时它会 运行 成功。我希望能够仅重新运行 工作流的 [Job 2] -> [Job 4]
分支,因为所有其他父作业都已成功完成。
这是否可以在 AWS Glue 中完成?我正在考虑尝试构建一个 AWS Step Functions workflow of glue jobs as Step Functions workflows seem to have this functionality.
自 2020 年 8 月起,现在可以执行此操作。
https://docs.aws.amazon.com/glue/latest/dg/resuming-workflow.html
我正在构建一个 AWS Glue 工作流程,该工作流程由 运行 长期作业组成,其中许多作业可能会失败。有什么方法可以在失败后重新 运行 工作流程中的特定分支?
例如,我的工作流程如下所示:
<Start Trigger> -> [Job 1] -> [Job 2] -> [Job 4]
↳ [Job 4]
假设 [Job 1]
和 [Job 4]
各花费 3 小时并且都成功完成。然后 [Job 2]
被触发但失败了,使我的工作流处于这种状态:
<Start Trigger> -> [Job 1 ✔] -> [Job 2 ✗] -> [Job 4]
↳ [Job 4 ✔]
我做了一个更改,修复了 [Job 2]
,并且相信在重新 运行 时它会 运行 成功。我希望能够仅重新运行 工作流的 [Job 2] -> [Job 4]
分支,因为所有其他父作业都已成功完成。
这是否可以在 AWS Glue 中完成?我正在考虑尝试构建一个 AWS Step Functions workflow of glue jobs as Step Functions workflows seem to have this functionality.
自 2020 年 8 月起,现在可以执行此操作。
https://docs.aws.amazon.com/glue/latest/dg/resuming-workflow.html