Airflow dag 大部分时间都在运行,但 "freezes" 时不时地运行。调试这个的最佳方法是什么?

Airflow dag runs most of the time, but "freezes" every now and then. What is the best way to debug this?

我的一个 Airflow DAG 运行 大多数时候都没有任何问题。但是,它时不时地(每隔 >3 小时)“冻结”。

在这种状态下,它的任务没有“排队”(见附图),特定任务上存在的超时也不会激活。摆脱这种情况的唯一方法是我手动将 运行 标记为失败。

这种失败总是伴随着另一个直接失败(参见图中的空白单元格)。

我应该在日志中寻找什么and/or调试这个的其他方法是什么?

发现问题,只是一些任务 运行 比计划时间长,因此并行加倍 运行。

我希望在这种情况下气流会在日志或 UI 中提供某种反馈,但事实并非如此。

已解决。