如何将 concourse 从 3.4.0 升级到 3.5.0 而不会导致作业因状态错误而中止?
How do I upgrade concourse from 3.4.0 to 3.5.0 without causing jobs to abort with state error?
当我将 concourse 从 3.4.0 升级到 3.5.0 时,突然所有 运行 作业从 运行 错误状态更改。我现在可以看到字符串 'no workers' 出现在他们日志的开头。手动启动作业或由下一个更改触发没有任何问题。
大厅本身升级成功
我当时正在观察 bosh 所做的事情,我看到在升级 web 或 db VM(我不知道是哪个)时,工作状态的这种变化是同时发生的。我很确定 bosh 还没有触及工作虚拟机。
有没有办法避免这种行为?
我们有一个数据库、一个网络虚拟机和六个工人。
只有一个 Web VM 可能会停止服务足够长的时间,以至于所有工作人员都过期了。工作人员不断心跳,如果他们错过两次心跳(默认情况下需要 1 分钟),他们就会停止。他们应该在部署完成后回来,但如果调度发生在他们心跳之前,那将导致这些错误。
当我将 concourse 从 3.4.0 升级到 3.5.0 时,突然所有 运行 作业从 运行 错误状态更改。我现在可以看到字符串 'no workers' 出现在他们日志的开头。手动启动作业或由下一个更改触发没有任何问题。
大厅本身升级成功
我当时正在观察 bosh 所做的事情,我看到在升级 web 或 db VM(我不知道是哪个)时,工作状态的这种变化是同时发生的。我很确定 bosh 还没有触及工作虚拟机。
有没有办法避免这种行为?
我们有一个数据库、一个网络虚拟机和六个工人。
只有一个 Web VM 可能会停止服务足够长的时间,以至于所有工作人员都过期了。工作人员不断心跳,如果他们错过两次心跳(默认情况下需要 1 分钟),他们就会停止。他们应该在部署完成后回来,但如果调度发生在他们心跳之前,那将导致这些错误。