RunDeck:重试失败的作业,但仅针对那些失败的节点
RunDeck: retry failed job but only for those nodes which has failed
我需要在一组主机(RunDeck 节点)上 运行 ansible 剧本。但是这些节点通常无法访问(IOT/home 设备)并且希望有一个正在执行以下逻辑的作业:
- 尝试在一组 100 个节点上执行特定的剧本
- 仅对失败的节点重试(不再对所有 100 个节点重新运行)
- 永远保持 运行ning 以确保作业在所有需要的节点上执行
现在:选项 https://docs.rundeck.com/docs/manual/creating-jobs.html#retry 似乎重新启动了整个工作 - 所以这不是我想要实现的。正确的 ?有什么办法可以实现上述目标吗? (我在 Apache Airflow 上 运行 another/similar 工作,我有很好的能力只重试失败的任务)
谢谢,
将您的作业设置为 运行 在所有节点中并行(编辑您的作业,转到节点选项卡,向下滚动到“线程计数”部分,然后设置节点数),然后在某些节点出现故障时,您可以再次 运行 only in failed nodes。
我需要在一组主机(RunDeck 节点)上 运行 ansible 剧本。但是这些节点通常无法访问(IOT/home 设备)并且希望有一个正在执行以下逻辑的作业:
- 尝试在一组 100 个节点上执行特定的剧本
- 仅对失败的节点重试(不再对所有 100 个节点重新运行)
- 永远保持 运行ning 以确保作业在所有需要的节点上执行
现在:选项 https://docs.rundeck.com/docs/manual/creating-jobs.html#retry 似乎重新启动了整个工作 - 所以这不是我想要实现的。正确的 ?有什么办法可以实现上述目标吗? (我在 Apache Airflow 上 运行 another/similar 工作,我有很好的能力只重试失败的任务)
谢谢,
将您的作业设置为 运行 在所有节点中并行(编辑您的作业,转到节点选项卡,向下滚动到“线程计数”部分,然后设置节点数),然后在某些节点出现故障时,您可以再次 运行 only in failed nodes。