AKS 升级失败:未设置 CloudProviderProfile

AKS Upgrade failed: CloudProviderProfile is not set

我们的 AKS 集群突然停止响应 az akskubectl 命令。我们尝试执行 az aks upgrade,因为之前已在此处推荐过。首先,我们从 1.7.7 成功升级到 1.7.7,但这并没有修复集群状态。接下来我们尝试从 1.7.7 升级到 1.7.12。不幸的是失败了,现在集群似乎无法运行。

这是升级命令最后的错误响应:

{
  "additionalProperties": {
    "endTime": "2018-03-07T14:15:43.7948662Z",
    "error": {
      "code": "ControlPlaneCloudProviderNotSet",
      "message": "CloudProviderProfile is not set"
    },
    "startTime": "2018-03-07T14:14:31.6196846Z",
    "status": "Failed"
  },
  "agentPoolProfiles": null,
  "dnsPrefix": null,
  "fqdn": null,
  "id": null,
  "kubernetesVersion": null,
  "linuxProfile": null,
  "location": null,
  "name": "03ae4ea8-58ef-0c47-8346-64a665d0edf7",
  "provisioningState": null,
  "servicePrincipalProfile": null,
  "tags": null,
  "type": null
}

我们在历史记录中发现了一个 GitHub 问题 https://github.com/Azure/AKS/issues/165,它看起来与我们在这里看到的相似。是同一个问题吗?

Correlation id: 7377a386-dfef-4c30-923d-b894001e14ac
Location: west-europe

GitHub 此 Whosebug post 的问题:https://github.com/Azure/AKS/issues/229

我可能会尝试使用以下方式再次设置上下文:

az aks get-credentials -n CLUSTER-NAME -g RESOURCE-GROUP

然后尝试升级而不设置版本:

az aks upgrade -n CLUSTER-NAME -g RESOURCE-GROUP

希望它能再次恢复。