如何在 GKE Autopilot 模式集群上启用和使用工作负载监控
How to enable & use workload monitoring on a GKE Autopilot mode cluster
Autopilot overview 文档声称处于自动驾驶模式的 Google Cloud Kubernetes Engine (GKE) 集群支持监控 预配置:系统监控 但是 可选:系统和工作负载监控。
我想在 Autopilot 集群上使用上述工作负载监控,使用 apiVersion: monitoring.gke.io/v1alpha1
和 kind: PodMonitor
CRD,as documented here。
然而,the UI says “无法在 Autopilot 集群中编辑云监控。” 和 gcloud container clusters update my-cluster --monitoring=WORKLOAD
表示 ERROR: (gcloud.container.clusters.update) Must include system monitoring if any monitoring is enabled.
但与 --monitoring=SYSTEM,WORKLOAD
说 ERROR: (gcloud.container.clusters.update) INVALID_ARGUMENT: Request contains an invalid argument.
如何在 Autopilot 集群中使用工作负载监控?
现在的诀窍是不使用 Web 控制台 UI,而是使用带有 gcloud
beta
的 CLI,
as documented here:
“注意:GKE 工作负载指标目前是预览版,因此请务必使用 gcloud beta 命令。”
另请注意“GKE 工作负载指标需要 GKE 控制平面版本 1.20.8-gke.2100 或更高版本”,
as documented here.
Autopilot overview 文档声称处于自动驾驶模式的 Google Cloud Kubernetes Engine (GKE) 集群支持监控 预配置:系统监控 但是 可选:系统和工作负载监控。
我想在 Autopilot 集群上使用上述工作负载监控,使用 apiVersion: monitoring.gke.io/v1alpha1
和 kind: PodMonitor
CRD,as documented here。
然而,the UI says “无法在 Autopilot 集群中编辑云监控。” 和 gcloud container clusters update my-cluster --monitoring=WORKLOAD
表示 ERROR: (gcloud.container.clusters.update) Must include system monitoring if any monitoring is enabled.
但与 --monitoring=SYSTEM,WORKLOAD
说 ERROR: (gcloud.container.clusters.update) INVALID_ARGUMENT: Request contains an invalid argument.
如何在 Autopilot 集群中使用工作负载监控?
现在的诀窍是不使用 Web 控制台 UI,而是使用带有 gcloud
beta
的 CLI,
as documented here:
“注意:GKE 工作负载指标目前是预览版,因此请务必使用 gcloud beta 命令。”
另请注意“GKE 工作负载指标需要 GKE 控制平面版本 1.20.8-gke.2100 或更高版本”, as documented here.