GCE - 没有节点的堆栈驱动程序内存指标
GCE - No stackdriver memory metrics for nodes
我已经使用
在 GCE 上设置了我的 Kubernetes 1.3.4 集群
export KUBE_ENABLE_CLUSTER_MONITORING=google
这工作得很好,我得到了应用程序日志(出于某种原因在 Container Engine 部分,但是很好)以及 pod 和节点指标。
唯一缺少的是节点内存指标,仅显示 CPU(见屏幕截图)
在 heapster 日志中,我看到了很多这样的行
{
metadata: {
severity: "ERROR"
projectId: "<project-id>"
serviceName: "container.googleapis.com"
zone: "europe-west1-d"
labels: {
container.googleapis.com/cluster_name: "production"
compute.googleapis.com/resource_type: "instance"
compute.googleapis.com/resource_name: "fluentd-cloud-logging-production-minion-group-p0w8"
container.googleapis.com/instance_id: "6772154497331326454"
container.googleapis.com/pod_name: "heapster-v1.1.0-2102007506-23b3e"
compute.googleapis.com/resource_id: "6772154497331326454"
container.googleapis.com/stream: "stderr"
container.googleapis.com/namespace_name: "kube-system"
container.googleapis.com/container_name: "heapster"
}
timestamp: "2016-09-13T14:40:08.000Z"
projectNumber: "930564692351"
}
textPayload: "E0913 14:40:08.665035 1 gcm.go:179] Error while sending request to GCM googleapi: Error 400: Timeseries 76, point: start is not older than end, for a cumulative metric, invalidParameter
"
insertId: "pt5bo7g132r266"
log: "heapster"
}
不确定这是否相关。
有什么想法吗?
如果您 运行 您的集群使用 GCE 而不是 GKE
您应该安装 stackdriver agent and verify the credentials that agent is using to communicate with stackdriver link
如果您正在使用 linux,您可以通过执行以下命令来安装代理:
curl -sSO https://dl.google.com/cloudagents/install-monitoring-agent.sh
sudo bash install-monitoring-agent.sh
您可以使用以下命令检查您的凭据 运行:
sudo cat $GOOGLE_APPLICATION_CREDENTIALS
sudo cat /etc/google/auth/application_default_credentials.json
我已经使用
在 GCE 上设置了我的 Kubernetes 1.3.4 集群export KUBE_ENABLE_CLUSTER_MONITORING=google
这工作得很好,我得到了应用程序日志(出于某种原因在 Container Engine 部分,但是很好)以及 pod 和节点指标。
唯一缺少的是节点内存指标,仅显示 CPU(见屏幕截图)
在 heapster 日志中,我看到了很多这样的行
{
metadata: {
severity: "ERROR"
projectId: "<project-id>"
serviceName: "container.googleapis.com"
zone: "europe-west1-d"
labels: {
container.googleapis.com/cluster_name: "production"
compute.googleapis.com/resource_type: "instance"
compute.googleapis.com/resource_name: "fluentd-cloud-logging-production-minion-group-p0w8"
container.googleapis.com/instance_id: "6772154497331326454"
container.googleapis.com/pod_name: "heapster-v1.1.0-2102007506-23b3e"
compute.googleapis.com/resource_id: "6772154497331326454"
container.googleapis.com/stream: "stderr"
container.googleapis.com/namespace_name: "kube-system"
container.googleapis.com/container_name: "heapster"
}
timestamp: "2016-09-13T14:40:08.000Z"
projectNumber: "930564692351"
}
textPayload: "E0913 14:40:08.665035 1 gcm.go:179] Error while sending request to GCM googleapi: Error 400: Timeseries 76, point: start is not older than end, for a cumulative metric, invalidParameter
"
insertId: "pt5bo7g132r266"
log: "heapster"
}
不确定这是否相关。
有什么想法吗?
如果您 运行 您的集群使用 GCE 而不是 GKE 您应该安装 stackdriver agent and verify the credentials that agent is using to communicate with stackdriver link
如果您正在使用 linux,您可以通过执行以下命令来安装代理:
curl -sSO https://dl.google.com/cloudagents/install-monitoring-agent.sh
sudo bash install-monitoring-agent.sh
您可以使用以下命令检查您的凭据 运行:
sudo cat $GOOGLE_APPLICATION_CREDENTIALS
sudo cat /etc/google/auth/application_default_credentials.json