如何查看 long-运行 AWS Step Function 失败的原因

How to see why a long-running AWS Step Function failed

我有一个带有许多状态转换的 AWS Step Function,可以 运行 半小时或更长时间。

只有几个状态,应用程序循环遍历它们,直到 运行 没有要处理的项目。

我有一个 运行 在大约半小时后失败了。我可以看看"Execution event history"下的logging。但是,由于这会记录每个转换和状态,因此会有数以千计的事件。我无法在不挂起浏览器 window.

的情况下向下翻页以显示足够多的事件(单击 "Load More" 按钮)

无法对我看到的这个列表进行排序或过滤。

如何找到失败的原因?有没有办法在某处导出执行事件历史记录?或者将其发送到 CloudWatch?

你如何处理你的步骤? Docker ECS 或 Fargate 上的容器?给我们一些细节。

您的任务应该在执行时将日志发送到 CloudWatch。 如果您的 运行 docker 在可以通过 SSH 访问的机器上,您还可以查看 Docker 自己在物理机器上的日志。

您可以将 AWS CLI 命令 aws stepfunctions get-execution-history--reverse-order 标志一起使用,以便首先从最近的(错误所在的位置)获取日志。