如何在 GKE Autopilot 模式集群上启用和使用工作负载监控

How to enable & use workload monitoring on a GKE Autopilot mode cluster

Autopilot overview 文档声称处于自动驾驶模式的 Google Cloud Kubernetes Engine (GKE) 集群支持监控 预配置:系统监控 但是 可选:系统和工作负载监控

我想在 Autopilot 集群上使用上述工作负载监控,使用 apiVersion: monitoring.gke.io/v1alpha1kind: PodMonitor CRD,as documented here

然而,the UI says “无法在 Autopilot 集群中编辑云监控。”gcloud container clusters update my-cluster --monitoring=WORKLOAD 表示 ERROR: (gcloud.container.clusters.update) Must include system monitoring if any monitoring is enabled. 但与 --monitoring=SYSTEM,WORKLOADERROR: (gcloud.container.clusters.update) INVALID_ARGUMENT: Request contains an invalid argument.

如何在 Autopilot 集群中使用工作负载监控?

现在的诀窍是不使用 Web 控制台 UI,而是使用带有 gcloud beta 的 CLI, as documented here: “注意:GKE 工作负载指标目前是预览版,因此请务必使用 gcloud beta 命令。”

另请注意“GKE 工作负载指标需要 GKE 控制平面版本 1.20.8-gke.2100 或更高版本”as documented here.