GKE 自动驾驶仪根本没有扩展
GKE autopilot not scaling up at all
我可以使用 GKE Autopilot 运行 沙盒项目上的任意工作负载(使用默认网络、默认服务帐户、默认防火墙规则)就好了。
但是我需要在一个现有项目中创建一个 GKE Autopilot 集群,该项目没有使用默认设置来处理网络等一些不同的事情,当我尝试时,pods 永远不会 运行.我的问题在于确定失败的根本原因以及项目设置的哪一部分阻止 GKE Autopilot 工作。
错误消息和日志非常非常稀少。我唯一看到的是:
- 在工作负载 UI 中,对于我的 pod,它显示“Pod unschedulable”
- 在 pod UI 中,在事件下,它显示“没有节点可用于调度 pods”和“pod 触发扩展:[{...url-一个实例组...}]"
- 在 cluster autoscaler 日志下,resultInfo 日志中有一个“scale.up.error.waiting.for.instances.timeout”(引用实例组 url)
我在网上找不到任何关于为什么在 Autopilot 模式下放大会失败的信息,这应该是一种不干涉的体验。我知道我没有提供有关 Pod 规范(任何都会失败!)或我的项目设置的详细信息,但只是了解下一步的位置对我目前的情况会有所帮助。
确保未禁用默认的 Compute Engine 服务帐户 (-compute@developer.gserviceaccount.com)。
运行 以下命令检查 disabled
字段是否设置为 true
gcloud iam service-accounts describe <PROJECT_NUMBER>-compute@developer.gserviceaccount.com
或者您可以在控制台中查看它的状态,in the IAM, services accounts sreen
可在此处找到有关解决此问题的更多详细信息:https://cloud.google.com/kubernetes-engine/docs/concepts/autopilot-overview#troubleshooting
我可以使用 GKE Autopilot 运行 沙盒项目上的任意工作负载(使用默认网络、默认服务帐户、默认防火墙规则)就好了。
但是我需要在一个现有项目中创建一个 GKE Autopilot 集群,该项目没有使用默认设置来处理网络等一些不同的事情,当我尝试时,pods 永远不会 运行.我的问题在于确定失败的根本原因以及项目设置的哪一部分阻止 GKE Autopilot 工作。
错误消息和日志非常非常稀少。我唯一看到的是:
- 在工作负载 UI 中,对于我的 pod,它显示“Pod unschedulable”
- 在 pod UI 中,在事件下,它显示“没有节点可用于调度 pods”和“pod 触发扩展:[{...url-一个实例组...}]"
- 在 cluster autoscaler 日志下,resultInfo 日志中有一个“scale.up.error.waiting.for.instances.timeout”(引用实例组 url)
我在网上找不到任何关于为什么在 Autopilot 模式下放大会失败的信息,这应该是一种不干涉的体验。我知道我没有提供有关 Pod 规范(任何都会失败!)或我的项目设置的详细信息,但只是了解下一步的位置对我目前的情况会有所帮助。
确保未禁用默认的 Compute Engine 服务帐户 (
运行 以下命令检查 disabled
字段是否设置为 true
gcloud iam service-accounts describe <PROJECT_NUMBER>-compute@developer.gserviceaccount.com
或者您可以在控制台中查看它的状态,in the IAM, services accounts sreen
可在此处找到有关解决此问题的更多详细信息:https://cloud.google.com/kubernetes-engine/docs/concepts/autopilot-overview#troubleshooting