Azure 可用性集、故障域和更新域

Azure Availability sets, Fault Domains, and Update Domains

我是 Azure 新手,需要一些说明:

将机器添加到可用性集中时,为了防止 VM 重新启动,VM 的最佳策略是什么,将它们放入:

-不同的更新域和故障域

-相同的更新域

-相同的故障域?

我的逻辑是将它们放在不同的更新和故障域中就足够了

我以此为参考:https://blogs.msdn.microsoft.com/plankytronixx/2015/05/01/azure-exam-prep-fault-domains-and-update-domains/

我说得对吗?

这些 update/fault 域令人困惑

三种情况会导致 Azure 中的虚拟机受到影响:计划外硬件维护、意外停机和计划内维护。

  • 计划外硬件维护
  • 意外停机
  • 计划维护事件

可用性集中的每个虚拟机都由底层 Azure 平台分配了一个更新域和一个故障域。对于给定的可用性集,默认分配五个非用户可配置的更新域(然后可以增加 Resource Manager 部署以提供多达 20 个更新域)以指示可以在同时。当在单个可用性集中配置了五个以上的虚拟机时,第六个虚拟机与第一个虚拟机放置在相同的更新域中,第七个虚拟机与第二个虚拟机放置在相同的更新域中,依此类推。更新域重启的顺序在计划维护期间可以不按顺序进行,而是一次只重启一个更新域。在对不同的更新域启动维护之前,重新启动的更新域有 30 分钟的恢复时间。

故障域定义了一组共享公共电源和网络交换机的虚拟机。默认情况下,在可用性集中配置的虚拟机在资源管理器部署中最多分为三个故障域(经典的两个故障域)。虽然将您的虚拟机放入可用性集中并不能保护您的应用程序免受操作系统或应用程序特定故障的影响,但它确实限制了潜在物理硬件故障、网络中断或电源中断的影响。

有关详细信息,请参阅此 documentation

My logic is that it's enough to put them in diffrent update AND fault domain

你说得对,我们应该将 VM 放在不同的更新域和故障域中。

我们将它们放在不同的更新域中,当Azure主机需要更新时,微软工程师会更新一个更新域,完成后,再更新另一个更新域。这样,我们的虚拟机 不会 同时 重新启动。

我们将它们放在不同的故障域中,当发生意外停机时,该故障域中的 VM 将重新启动,其他 VM 将保持 运行,这样,我们的应用程序 运行 VM 将保持健康。

要拍摄,将 VM 添加到具有不同更新域和故障域的可用性集,这将获得高 SLA,但并不意味着一个 VM 不会重新启动。

希望对您有所帮助。