OOZIE 卡在 RUNNING 状态

OOZIE stuck in RUNING status

我使用 OOZIE 运行 工作流程。但是一个简单的官方例子 shell-wf (echo hello oozie) 卡在 运行 状态,永远不会结束。工作流可以提交但卡在 运行 状态。 OOZIE 中的作业日志没有任何错误 UI。

当提交一个里面有spark-submit的shell时,作业将永远不会被提交,并且在Spark UI中是看不到的。我怀疑 shell 根本没有 运行。

可能的问题是什么?

快速清单

对于那些有同样问题的人,有一个清单来检查你的系统。希望对您有所帮助!

  1. 检查 Oozie 配置中的 jobTracker注意:如果作业已经成功运行,那可能不是jobTracker的问题。相关讨论可见here
  2. 检查您的磁盘使用情况。如果## Heading ##disk usage 大于 90%,请删除一些文件以确保磁盘使用率小于 90%。 (这就是我的情况!)
  3. 检查卡住动作的Console URL。它可以在 Job - Job Info tab - Actions - Action - Action Info tab 中找到。此处的工作状态可能会帮助您找到问题。
  4. 检查 Oozie 日志。它通常在 /usr/local/oozie/logs 中。检查 oozie.log* 以查找是否存在异常。

详情

磁盘使用情况

如果你的动作状态是

YarnApplicationState: ACCEPTED: waiting for AM container to be allocated, launched and register with RM.

那可能是磁盘问题。相关讨论可见MapReduce job hangs, waiting for AM container to be allocated. Solutions can be found in .