GKE 上的 Kubernetes heapster 过度指标报告

Kubernetes heapster excessive metric reporting on GKE

我 运行 Google 容器引擎 (GKE) 上的一个小型 3 节点 kubernetes 集群,指标记录到 Google 云监控 (GCM)。最近我注意到不再向 GCM 报告指标。 heapster 日志显示请求因超出 GCM 配额而被拒绝。

在 Google Developers Console 上检查 API 管理器,我发现使用量超过了 50000 req/day 配额。

现在,每次我启动 heapster pod 时,它平均会以 2-5 req/s 锤击 GCM 接收器。

我尝试增加 heapster sink_frequency 参数,但这只会导致请求更多,频率更低,随着时间的推移加起来相同。

master 和 nodes 都在最新的 Kubernetes 1.1.3 版本上。

有人在 GKE 上看到过这个吗?我可以做些什么来恢复对 GCL 的正常请求水平?目前,在配额用完之前,我每天只能获得几个小时的指标。

答案有点取决于您的设置,但听起来您正在尝试自己设置 Heapster,启用 Google 云监控 ("gcm") 接收器.此设置在用完配额方面存在明确问题,不建议 GKE 用户使用。您可以通过增加 stats_resolution 选项来减少请求的数量,这样推送到 GCM 的数据就会减少,但最好还是切换到 GKE 的 built-in GCM 集成。

您可以通过从集群中删除 custom-configured Heapster pod/replication 控制器来启用 built-in 集成,然后确保通过 [=25= 为您的集群启用云监控] gcloud alpha container clusters update CLUSTERNAME --monitoring-service=monitoring.googleapis.com。然后,您应该能够在 UI 中找到您的指标(在 one-time 最多延迟一个小时后),如 this recent blog post on GKE and GCM.

中所述