问题:GKE 集群节点详细信息中的空图形(此时间间隔没有数据)。我该如何解决?

Problem: empty graphics in GKE cluster node detail (No data for this time interval). How can I fix it?

我在 Google 云中有一个集群。但我需要知道有关资源使用情况的信息。 在每个节点的界面中有三个关于CPU、内存和磁盘使用情况的图形。但是每个节点中的所有这些图形在任何时间间隔内都有警告 "No data for this time interval"。

我将所有集群和节点升级到最新版本 1.15.4-gke.22,并将 "Legacy Stackdriver Logging" 更改为 "Stackdriver Kubernetes Engine Monitoring"。

但这并没有帮助。 在 Stackdriver Workspace 中只有 "disk_read_bytes" 带有图形,Metric Explorer 中的任何其他请求只有消息 "No data for this time interval"

如果我在命令行中请求 "kubectl top nodes",我会看到 CPU 和内存的当前数据。但我需要在节点详细信息页面上查看它以了解峰值负载。我该如何配置它?

实际上这听起来很奇怪,因为如果您可以在命令行中获取指标,而 Stackdriver 界面不显示它们,则可能是一个错误。

我建议这样做:如果可以的话,用最少的资源创建一个集群,检查相同的 Stackdriver 指标,如果有指标,它可能是一个错误,您可以在适当的 GCP 频道中报告它。

查看有关如何在 GCP 中获得支持的文档:

Best Practices for Working with Cloud Support

Getting support for Google Cloud

就我而言,我缺少与集群关联的 IAM 服务帐户的权限 - 确保它具有以下角色:

  • 监控指标编写器(roles/monitoring.metricWriter
  • 日志编写器(roles/logging.logWriter
  • Stackdriver 资源元数据编写器(roles/stackdriver.resourceMetadata.writer

这是documented here