找不到 gke 指标工作负载
Can't find gke metrics workload
我发现新的 gke 指标工作负载是一个非常有趣的选项,用于测试来自自定义端点的 prometheus 输出。
我在 1.21.5-gke.1302 中配置了我的 gke 集群,以在 monitoring_configuration 中使用 WORKLOADS,它在集群 kube-admin 命名空间上创建了所有必要的 pods。我还有 kubernetes 中可用的 podmonitor 资源,似乎已准备就绪。
但是当我进入 stackdriver metrics explorer 时,我似乎看不到我的指标。我试图进入资源类型“Kubernetes Container”,但找不到任何“workload.googleapis.com/”。已经 运行 一小时了,我找不到指标。
有没有人设法从服务中获取指标?
是的,我今天刚玩过这个。
首先检查 gcloud beta container clusters describe 以查看您的集群是否认为它也应该收集工作负载指标。您应该在启用的指标组件部分找到“WORKLOADS”。
gcloud beta container clusters describe example-cluster --zone chosen-zone
如果此功能已启用,请浏览 docs 以查看您在启用它的过程中遗漏了什么。
好的,所以我们终于找到了问题所在。这是 pod 端口名称中的一个拼写错误,但由于在我们添加 podmonitor 时没有想到要查看那里之前其他一切都在工作。
通过对端口名称的修复,它似乎可以工作,即使它有时会出现故障,但现在它可以工作了。