更改主节点后 DC/OS 仪表板中的指标变化

Flapping metrics in DC/OS dashboard after changing master nodes

将 DC/OS 1.8 集群中的三个主节点中的两个更改为更新的 CoreOS 版本(其中一个具有针对 DirtyCOW 漏洞修补的内核)后,主节点停止工作。仪表板显示一个空的数据中心。

我们将 /var/lib/dcos 从旧主节点同步到两个新主节点。然后仪表板再次开始工作。 DC/OS 仪表板仍然显示波动指标。 我们有一个 mesos.leader 和一个动物园管理员领导。

如何稳定集群?

上次发生这种情况时,我们不得不重新安装集群。我刚刚一次停止一个主节点以增加磁盘大小。我们现在回到了拍打状态。我认为重新安装是我们的未来。我现在正在寻找答案以帮助避免这种情况。