GCP 监控无法从 asia-southeast1-b 获取指标

GCP Monitoring can't get metrics from asia-southeast1-b

我有几个 GCE 实例位于两个区域:asia-southeast1-bus-east4-c。所有实例都已安装 stackdriver 代理。在指标资源管理器中,我无法在 CPU load 指标中找到 asia-southeast1-b

但是CPU Usage还可以:

这有什么问题?

你能在部署在 asia-southeast1-b 的虚拟机中执行这个命令吗:

grep collectd /var/log/{syslog,messages} | tail

这将显示代理是否有任何错误。

据我了解,此指标(CPU 负载)是从 Stackdriver 代理重新收集的,然后发送到 Monitoring。 让我们看看我们是否能理解发生了什么:

  • Stackdriver Agent 收集该指标有问题吗?

  • 或者在摄取的时候监控API有问题吗?

让我问你一些问题:

  • 与 us-east4-c 中的 运行 相比,您是否在 asia-southeast1-b 上的实例上使用了不同的操作系统?
  • 你是哪个版本的 Stackdriver 运行? 在此 link 中,您将能够确定您安装的是哪个版本。[2]

  • 您是否对 Stackdriver 代理的配置进行了任何更改?该文件位于 /etc/stackdriver/collectd.conf

此致,


[1] https://cloud.google.com/monitoring/agent/install-agent#agent-version

我已通过向服务帐户添加 Monitoring Metric Writer 权限修复了此错误。