Hyper-V 来宾在 2016 年实时迁移后卡住了
Hyper-V guests stuck after live migrating on 2016
我一直在处理集群上的一些问题,来宾在实时迁移时会卡住。我在对 Server 2016 核心应用最新的累积更新后注意到了这个问题,但我只是猜测。
首先,让我简单介绍一下环境:
- 服务器 2016 核心
- 3PAR 8200 SAN
- 故障转移群集中的十个节点
- HV04 和 HV11 上发生了虚拟机卡住。 HV11 于 2/13/2018 重新安装为 HV07,并重新加入集群。它发生在今天的 HV07(上图)。
我已经联系了 Microsoft,但他们的帮助不大。他们声称这是一个 WMI 问题,我需要重建 MOF 文件,但即使是这样,我也需要知道损坏的内容,以便我可以尝试找出可能损坏它的内容。我已经获取了 vmms.exe 服务的用户进程转储和使用 livekd 的内核转储,但我仍在研究如何查看问题所在。
我注意到的另一件事是,发生此问题时 Hyper-V 管理服务无法停止,而且我注意到 WMI 服务也有停止问题。我并不是说它不是 WMI 服务,但如果是,那么我需要找出导致此问题的原因(如果它是由 Microsoft 提供的补丁引起的)。
还有其他人运行参与其中吗?
他们现在有一个补丁:
https://support.microsoft.com/en-us/help/4077525/windows-10-update-kb4077525
解决了导致使用 Hyper-V 副本或 Azure Site Recovery 复制的 Hyper-V VM 在 92% 时停止响应的问题,如果 Windows Server 2016 故障转移群集设置为启用了 NIC Teaming。在停止 VM、实时迁移期间、停止 VMMS 服务或主机节点关闭期间,也会出现此问题。然后用户必须在主机上使用硬重启来恢复。
我一直在处理集群上的一些问题,来宾在实时迁移时会卡住。我在对 Server 2016 核心应用最新的累积更新后注意到了这个问题,但我只是猜测。
首先,让我简单介绍一下环境:
- 服务器 2016 核心
- 3PAR 8200 SAN
- 故障转移群集中的十个节点
- HV04 和 HV11 上发生了虚拟机卡住。 HV11 于 2/13/2018 重新安装为 HV07,并重新加入集群。它发生在今天的 HV07(上图)。
我已经联系了 Microsoft,但他们的帮助不大。他们声称这是一个 WMI 问题,我需要重建 MOF 文件,但即使是这样,我也需要知道损坏的内容,以便我可以尝试找出可能损坏它的内容。我已经获取了 vmms.exe 服务的用户进程转储和使用 livekd 的内核转储,但我仍在研究如何查看问题所在。
我注意到的另一件事是,发生此问题时 Hyper-V 管理服务无法停止,而且我注意到 WMI 服务也有停止问题。我并不是说它不是 WMI 服务,但如果是,那么我需要找出导致此问题的原因(如果它是由 Microsoft 提供的补丁引起的)。
还有其他人运行参与其中吗?
他们现在有一个补丁: https://support.microsoft.com/en-us/help/4077525/windows-10-update-kb4077525
解决了导致使用 Hyper-V 副本或 Azure Site Recovery 复制的 Hyper-V VM 在 92% 时停止响应的问题,如果 Windows Server 2016 故障转移群集设置为启用了 NIC Teaming。在停止 VM、实时迁移期间、停止 VMMS 服务或主机节点关闭期间,也会出现此问题。然后用户必须在主机上使用硬重启来恢复。