通过stackdriver监控gce的内存
monitor memory of gce by stackdriver
我想监控 gcp vm 的内存,我已经安装了监控代理,从 link.
一步步来
问题是我仍然无法在 Stackdriver 仪表板上获取内存信息。
我错过了什么吗?
当我输入 "sudo service stackdriver-agent status"
获取日志 "write_gcm: can not take infinite value"
这是什么意思?
这两者之间有联系吗?
由于 Stackdriver 代理处于活动状态,您应该检查它是否实际生成并推送任何数据。您可以从以下基本检查开始:
- 重新启动代理。
- 尝试图表上的另一个时间段(1D 或 1W)。
- 尝试 CPU 指标并查看是否显示数据。
- 检查系统日志(journalctl,/var/log/syslog,
/var/log/messages) 对于包含 "collectd" 或
"stackdriver-agent"。
- 验证 VM 使用的服务帐户。如果您使用自定义服务帐户,请确保它具有角色 "roles/monitoring.metricWriter"。参见 Access control。
- 通过手动调用 API Explorer
中的 timeseries.list 方法验证数据是否到达 Monitoring
此处详细描述了故障排除步骤:Troubleshooting Agent Installation
错误 "write_gcm: can not take infinite value" 可能是由禁用交换引起的。
我想监控 gcp vm 的内存,我已经安装了监控代理,从 link.
一步步来问题是我仍然无法在 Stackdriver 仪表板上获取内存信息。 我错过了什么吗?
当我输入 "sudo service stackdriver-agent status" 获取日志 "write_gcm: can not take infinite value" 这是什么意思? 这两者之间有联系吗?
由于 Stackdriver 代理处于活动状态,您应该检查它是否实际生成并推送任何数据。您可以从以下基本检查开始:
- 重新启动代理。
- 尝试图表上的另一个时间段(1D 或 1W)。
- 尝试 CPU 指标并查看是否显示数据。
- 检查系统日志(journalctl,/var/log/syslog, /var/log/messages) 对于包含 "collectd" 或 "stackdriver-agent"。
- 验证 VM 使用的服务帐户。如果您使用自定义服务帐户,请确保它具有角色 "roles/monitoring.metricWriter"。参见 Access control。
- 通过手动调用 API Explorer 中的 timeseries.list 方法验证数据是否到达 Monitoring
此处详细描述了故障排除步骤:Troubleshooting Agent Installation
错误 "write_gcm: can not take infinite value" 可能是由禁用交换引起的。