GCP 监控无法从 asia-southeast1-b 获取指标
GCP Monitoring can't get metrics from asia-southeast1-b
我有几个 GCE 实例位于两个区域:asia-southeast1-b
和 us-east4-c
。所有实例都已安装 stackdriver 代理。在指标资源管理器中,我无法在 CPU load
指标中找到 asia-southeast1-b
:
但是CPU Usage
还可以:
这有什么问题?
你能在部署在 asia-southeast1-b 的虚拟机中执行这个命令吗:
grep collectd /var/log/{syslog,messages} | tail
这将显示代理是否有任何错误。
据我了解,此指标(CPU 负载)是从 Stackdriver 代理重新收集的,然后发送到 Monitoring。
让我们看看我们是否能理解发生了什么:
Stackdriver Agent 收集该指标有问题吗?
或者在摄取的时候监控API有问题吗?
让我问你一些问题:
- 与 us-east4-c 中的 运行 相比,您是否在 asia-southeast1-b 上的实例上使用了不同的操作系统?
你是哪个版本的 Stackdriver 运行?
在此 link 中,您将能够确定您安装的是哪个版本。[2]
您是否对 Stackdriver 代理的配置进行了任何更改?该文件位于 /etc/stackdriver/collectd.conf
此致,
[1] https://cloud.google.com/monitoring/agent/install-agent#agent-version
我已通过向服务帐户添加 Monitoring Metric Writer
权限修复了此错误。
我有几个 GCE 实例位于两个区域:asia-southeast1-b
和 us-east4-c
。所有实例都已安装 stackdriver 代理。在指标资源管理器中,我无法在 CPU load
指标中找到 asia-southeast1-b
:
但是CPU Usage
还可以:
这有什么问题?
你能在部署在 asia-southeast1-b 的虚拟机中执行这个命令吗:
grep collectd /var/log/{syslog,messages} | tail
这将显示代理是否有任何错误。
据我了解,此指标(CPU 负载)是从 Stackdriver 代理重新收集的,然后发送到 Monitoring。 让我们看看我们是否能理解发生了什么:
Stackdriver Agent 收集该指标有问题吗?
或者在摄取的时候监控API有问题吗?
让我问你一些问题:
- 与 us-east4-c 中的 运行 相比,您是否在 asia-southeast1-b 上的实例上使用了不同的操作系统?
你是哪个版本的 Stackdriver 运行? 在此 link 中,您将能够确定您安装的是哪个版本。[2]
您是否对 Stackdriver 代理的配置进行了任何更改?该文件位于 /etc/stackdriver/collectd.conf
此致,
[1] https://cloud.google.com/monitoring/agent/install-agent#agent-version
我已通过向服务帐户添加 Monitoring Metric Writer
权限修复了此错误。