GCE - 没有节点的堆栈驱动程序内存指标

GCE - No stackdriver memory metrics for nodes

我已经使用

在 GCE 上设置了我的 Kubernetes 1.3.4 集群

export KUBE_ENABLE_CLUSTER_MONITORING=google

这工作得很好,我得到了应用程序日志(出于某种原因在 Container Engine 部分,但是很好)以及 pod 和节点指标。

唯一缺少的是节点内存指标,仅显示 CPU(见屏幕截图)

No memory metrics

在 heapster 日志中,我看到了很多这样的行

{
 metadata: {
  severity: "ERROR"    
  projectId: "<project-id>"    
  serviceName: "container.googleapis.com"    
  zone: "europe-west1-d"    
  labels: {
   container.googleapis.com/cluster_name: "production"     
   compute.googleapis.com/resource_type: "instance"     
   compute.googleapis.com/resource_name: "fluentd-cloud-logging-production-minion-group-p0w8"     
   container.googleapis.com/instance_id: "6772154497331326454"     
   container.googleapis.com/pod_name: "heapster-v1.1.0-2102007506-23b3e"     
   compute.googleapis.com/resource_id: "6772154497331326454"     
   container.googleapis.com/stream: "stderr"     
   container.googleapis.com/namespace_name: "kube-system"     
   container.googleapis.com/container_name: "heapster"     
  }
  timestamp: "2016-09-13T14:40:08.000Z"    
  projectNumber: "930564692351"    
 }
 textPayload: "E0913 14:40:08.665035       1 gcm.go:179] Error while sending request to GCM googleapi: Error 400: Timeseries 76, point: start is not older than end, for a cumulative metric, invalidParameter
"   
 insertId: "pt5bo7g132r266"   
 log: "heapster"   
}

不确定这是否相关。

有什么想法吗?

如果您 运行 您的集群使用 GCE 而不是 GKE 您应该安装 stackdriver agent and verify the credentials that agent is using to communicate with stackdriver link

如果您正在使用 linux,您可以通过执行以下命令来安装代理:

curl -sSO https://dl.google.com/cloudagents/install-monitoring-agent.sh
sudo bash install-monitoring-agent.sh

您可以使用以下命令检查您的凭据 运行:

sudo cat $GOOGLE_APPLICATION_CREDENTIALS
sudo cat /etc/google/auth/application_default_credentials.json