此容器服务处于失败状态

This container service is in a failed state

我们所有的 AKS 集群都在 Azure 门户中报告了以下错误:

This container service is in a failed state. Click here to open a new support request.

看来我们也无法编辑集群。尝试扩展节点时,出现以下错误:

Failed to save container service 'test-aks'. Error: Operation is not allowed while cluster is being upgrading or failed in upgrade

查看 AKS 属性时,我看到配置状态为 "Failed":

我们不知道如何解决这个问题。

对于您显示的问题:

This container service is in a failed state. Click here to open a new support request.

我也遇到过。通常,用户对资源的使用有一定的限制。在我这边,我只能使用 10 个 vCpu。因此,如果 vCpu 还剩 none,则在扩展更多节点时出现错误。我认为这对您来说也是一个可能的原因。你可以去看看。

使用 az aks scale 命令使用 Azure CLI 缩放群集节点,如下所述:https://docs.microsoft.com/en-us/azure/aks/scale-cluster#scale-the-cluster-nodes

az aks show --resource-group myResourceGroup --name myAKSCluster --query agentPoolProfiles

这将显示 Azure CLI 中的描述性错误消息。 您可能超出了核心配额的限制。 在此线程上讨论了更多详细信息:https://github.com/Azure/AKS/issues/542