Azure 询问未找到节点
Azure aks no nodes found
我创建了一个具有 3 个节点的 azure AKS(标准 DS3 v2(4 个 vcpus,14 GB 内存))。我正在摆弄集群并创建了一个部署 1000 replicas.After 这个完整的集群崩溃了。
azureuser@saa:~$ k get cs
NAME STATUS MESSAGE ERROR
controller-manager Unhealthy Get http://127.0.0.1:10252/healthz: dial tcp 127.0.0.1:10252: getsockopt: connection refused
scheduler Unhealthy Get http://127.0.0.1:10251/healthz: dial tcp 127.0.0.1:10251: getsockopt: connection refused
etcd-0 Healthy {"health": "true"}
从调试来看,调度程序和控制器管理器似乎都出现了故障。如何解决这个问题?
创建具有 1000 个副本的 Deployment 时到底发生了什么?应该由k8s照顾吗?
很少有调试命令输出:
kubectl cluster-info
Kubernetes master is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443
Heapster is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/heapster/proxy
KubeDNS is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kube-dns:dns/proxy
kubernetes-dashboard is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kubernetes-dashboard/proxy
kubectl cluster-info dump
@http://termbin.com/e6wb
的日志
azureuser@sim:~$ az aks scale -n cg -g cognitive-games -c 4 --verbose
Deployment failed. Correlation ID: 4df797b2-28bf-4c18-a26a-4e341xxxxx. Operation failed with status: 200. Details: Resource state Failed
没有显示节点
azureuser@si:~$ k get nodes
No resources found
看起来很傻,但是当在 RG 中创建 AKS 时,令人惊讶的是创建了两个 RG,一个使用 AKS,另一个使用具有所有 VMS 的随机散列。我删除了第二个 RG,基本的 AKS 停止工作。
我创建了一个具有 3 个节点的 azure AKS(标准 DS3 v2(4 个 vcpus,14 GB 内存))。我正在摆弄集群并创建了一个部署 1000 replicas.After 这个完整的集群崩溃了。
azureuser@saa:~$ k get cs
NAME STATUS MESSAGE ERROR
controller-manager Unhealthy Get http://127.0.0.1:10252/healthz: dial tcp 127.0.0.1:10252: getsockopt: connection refused
scheduler Unhealthy Get http://127.0.0.1:10251/healthz: dial tcp 127.0.0.1:10251: getsockopt: connection refused
etcd-0 Healthy {"health": "true"}
从调试来看,调度程序和控制器管理器似乎都出现了故障。如何解决这个问题?
创建具有 1000 个副本的 Deployment 时到底发生了什么?应该由k8s照顾吗?
很少有调试命令输出:
kubectl cluster-info
Kubernetes master is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443
Heapster is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/heapster/proxy
KubeDNS is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kube-dns:dns/proxy
kubernetes-dashboard is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kubernetes-dashboard/proxy
kubectl cluster-info dump
@http://termbin.com/e6wb
azureuser@sim:~$ az aks scale -n cg -g cognitive-games -c 4 --verbose
Deployment failed. Correlation ID: 4df797b2-28bf-4c18-a26a-4e341xxxxx. Operation failed with status: 200. Details: Resource state Failed
没有显示节点
azureuser@si:~$ k get nodes
No resources found
看起来很傻,但是当在 RG 中创建 AKS 时,令人惊讶的是创建了两个 RG,一个使用 AKS,另一个使用具有所有 VMS 的随机散列。我删除了第二个 RG,基本的 AKS 停止工作。