如何在集群中的一个节点出现故障时重新启动已部署的应用程序?

How to restart deployed app when one node in cluster goes down?

当集群中的一个节点(2 个节点Active/Passive)出现故障时,我必须重新启动已部署的应用程序,如何处理节点故障然后重新启动应用程序?

我正在使用 mod_cluster 进行 hot_standby 和负载平衡。

如果您正在尝试这样做,您不能从平衡器重新启动应用程序服务器吗?

如果您的应用程序崩溃或未部署,您可以在服务器上运行一个 crontask 并检查应用程序的状态

如果您在云环境(例如 AWS)中托管,您可以使用 EC2 API 来重启任何已从平衡器变得无响应的实例