我在哪里可以获得节点导出器指标描述?
Where can I get node exporter metrics description?
我刚开始使用 prometheus、node exporter 等监控 k8s 集群。
我想知道指标的确切含义,尽管指标名称是自我描述的。
我已经查看了node exporter的github,但是没有得到有用的信息。
从哪里可以获得节点导出器指标的描述?
谢谢
每个指标都有一个简短的描述。如果您在浏览器中打开节点导出器或只是 curl http://my-node-exporter:9100/metrics
,您可以看到它们。您将看到所有导出的指标和带有 # HELP
的行是描述性指标:
# HELP node_cpu_seconds_total Seconds the cpus spent in each mode.
# TYPE node_cpu_seconds_total counter
node_cpu_seconds_total{cpu="0",mode="idle"} 2.59840376e+07
Grafana 可以在编辑器中显示此帮助消息:
普罗米修斯(最近的实验编辑器)也可以展示它:
这适用于所有指标,而不仅仅是节点导出器的指标。如果您需要有关这些值的更多技术细节,我建议您在 Google 和 man
页面中搜索信息(如果您在 Linux 上)。节点导出器几乎按原样从 /proc
获取大部分指标,并且不难找到详细信息。以 node_memory_KReclaimable_bytes
为例。 'Bytes' 后缀显然是单位,node_memory
只是一个命名空间前缀,而 KReclaimable
是实际的度量名称。使用 man -K KReclaimable
将带您进入 proc(5) 手册页,您可以在其中找到:
KReclaimable %lu (since Linux 4.20)
Kernel allocations that the kernel will attempt to
reclaim under memory pressure. Includes
SReclaimable (below), and other direct allocations
with a shrinker.
最后,如果这种了解更多指标的意图是出于为您的硬件配置警报的愿望,您可以跳到最后一部分并从这里获取社区共享的一些警报:https://awesome-prometheus-alerts.grep.to/rules#host-and-hardware
我刚开始使用 prometheus、node exporter 等监控 k8s 集群。
我想知道指标的确切含义,尽管指标名称是自我描述的。
我已经查看了node exporter的github,但是没有得到有用的信息。
从哪里可以获得节点导出器指标的描述?
谢谢
每个指标都有一个简短的描述。如果您在浏览器中打开节点导出器或只是 curl http://my-node-exporter:9100/metrics
,您可以看到它们。您将看到所有导出的指标和带有 # HELP
的行是描述性指标:
# HELP node_cpu_seconds_total Seconds the cpus spent in each mode.
# TYPE node_cpu_seconds_total counter
node_cpu_seconds_total{cpu="0",mode="idle"} 2.59840376e+07
Grafana 可以在编辑器中显示此帮助消息:
man
页面中搜索信息(如果您在 Linux 上)。节点导出器几乎按原样从 /proc
获取大部分指标,并且不难找到详细信息。以 node_memory_KReclaimable_bytes
为例。 'Bytes' 后缀显然是单位,node_memory
只是一个命名空间前缀,而 KReclaimable
是实际的度量名称。使用 man -K KReclaimable
将带您进入 proc(5) 手册页,您可以在其中找到:
KReclaimable %lu (since Linux 4.20)
Kernel allocations that the kernel will attempt to
reclaim under memory pressure. Includes
SReclaimable (below), and other direct allocations
with a shrinker.
最后,如果这种了解更多指标的意图是出于为您的硬件配置警报的愿望,您可以跳到最后一部分并从这里获取社区共享的一些警报:https://awesome-prometheus-alerts.grep.to/rules#host-and-hardware