找不到 gke 指标工作负载

Can't find gke metrics workload

我发现新的 gke 指标工作负载是一个非常有趣的选项,用于测试来自自定义端点的 prometheus 输出。

我在 1.21.5-gke.1302 中配置了我的 gke 集群,以在 monitoring_configuration 中使用 WORKLOADS,它在集群 kube-admin 命名空间上创建了所有必要的 pods。我还有 kubernetes 中可用的 podmonitor 资源,似乎已准备就绪。

但是当我进入 stackdriver metrics explorer 时,我似乎看不到我的指标。我试图进入资源类型“Kubernetes Container”,但找不到任何“workload.googleapis.com/”。已经 运行 一小时了,我找不到指标。

有没有人设法从服务中获取指标?

是的,我今天刚玩过这个。

首先检查 gcloud beta container clusters describe 以查看您的集群是否认为它也应该收集工作负载指标。您应该在启用的指标组件部分找到“WORKLOADS”。

gcloud beta container clusters describe example-cluster --zone chosen-zone

如果此功能已启用,请浏览 docs 以查看您在启用它的过程中遗漏了什么。

好的,所以我们终于找到了问题所在。这是 pod 端口名称中的一个拼写错误,但由于在我们添加 podmonitor 时没有想到要查看那里之前其他一切都在工作。

通过对端口名称的修复,它似乎可以工作,即使它有时会出现故障,但现在它可以工作了。