如果 Azure 存储帐户丢失,如何重新连接 VHDx?

How do you reconnect VHDs if Azure's Storage Account drops off?

Azure 的 Twitter 支持人员要求我在此处 post(而不是 ServerFault.com)。

我们的 Kubernetes 环境已经运行了一个多星期,无需更改,24 个 VHD 都使用 Azure 上的容器服务。

然后我们突然收到所有服务已停止工作的警报。所有 pods 使用 Persistent Volume Claims 都卡在 ContainerCreating 上。快速 kubectl describe pod podname 显示:

Unable to mount volumes for pod "***-1370023040-st581_default(9b050936-1baa-11e7-9b77-000d3ab513dc)": timeout expired waiting for volumes to attach/mount for pod "default"/"***-1370023040-st581". list of unattached/unmounted volumes=[***-persistent-storage]

Error syncing pod, skipping: timeout expired waiting for volumes to attach/mount for pod "default"/"***-1370023040-st581". list of unattached/unmounted volumes=[***-persistent-storage]

所有pods。

在 Azure 门户中,我可以针对代理看到只有代理 OS VHD 作为磁盘附加。手动尝试添加磁盘失败并显示:

Failed to update disks for the virtual machine 'k8s-agent-CD93CDEA-0'. Error: A disk named '***mgmt-dynamic-pvc-018bdc6e-161a-11e7-8ca8-000d3ab513dc.vhd' already uses the same VHD URL …https://***.blob.core.windows.net/vhds/***mgmt-dynamic-pvc-018bdc6e-161a-11e7-8ca8-000d3ab513dc.vhd ….

重新启动 agent/master 也无法解决问题。

代理端我们用的是F16S,支持32个数据盘

如何重新附加 VHD 以重新开始?

这一定是 Azure 中的系统中断,因为它们会自行恢复(将近 48 小时的中断,它向我们收取资源费用!)。

原来你必须为 Azure 的系统中断支付支持费用。

Twitter 支持团队创建了一张免费票。他们的电话支持证实这是一个工程问题。