高可用性集群 Active/passive 使用 Pacemaker 和 drbd primary auto 设置失败后自动接管

High availability Cluster Active/passive Setup using Pacemaker and drbd primary auto takes over after a failure

按照下面的指南,我成功地设置了一个主动-被动集群节点。但我注意到,当主要失败并重新启动时,它不会收回主要角色。我应该在 crm 中配置什么设置,以确保当主服务器在故障后恢复时,它会从备用计算机恢复为主服务器?

https://www.theurbanpenguin.com/drbd-pacemaker-ha-cluster-ubuntu-16-04/

你可以通过无限位置约束来做到这一点。类似于:

location fs-on-alice fs_res inf: alice

通常不建议自动故障回复。在理想的 HA 配置中,当前主要的系统根本不重要。此外,我还看到过节点每 10-20 分钟间歇性 panics/reboots 的情况。现在您有服务故障转移,stopping/restarting,每小时几次。如果不是因为位置限制和自动故障回复,您将不会有此行为。

好吧,给出 "inf" 位置规则将始终强制资源 运行 仅在爱丽丝上。如果 alice 因维护而停机,那么该资源将不会 运行 在任何其他节点上。你想添加的东西叫做粘性。

pcs constraint location fs_res prefers alice =50

更多详情请参考:http://clusterlabs.org/pacemaker/doc/en-US/Pacemaker/1.1/html/Clusters_from_Scratch/_prefer_one_node_over_another.html