如何使用 Prometheus 显示集群的聚合 CPU、RAM、磁盘 I/O 使用情况？

Question

我有 3 个服务器。我将 Prometheus 与 Node exporter 结合使用，为了可视化 Prometheus 数据，我使用了 Grafana。 Node Exporter Full (1860) 仪表板只能单独显示每个服务器的 CPU、RAM、磁盘 I/O 使用情况。我想获得总体使用情况，例如，我想获得整个集群的 (sarver1 + sarver2 + sarver3) 聚合 CPU、RAM 和磁盘 I/O 使用情况。我应该使用什么查询来获取集群资源的总利用率？

Answer 1

假设您有以下查询来获取 CPU 用法：

100 - (avg(irate(node_cpu_seconds_total{instance="server1",mode="idle"}[5m])) * 100)

要获取多个服务器的总和，您需要将查询更改为以下内容：

100 - (avg(irate(node_cpu_seconds_total{instance=~"server1|server2|server3",mode="idle"}[5m])) * 100)

如何使用 Prometheus 显示集群的聚合 CPU、RAM、磁盘 I/O 使用情况？

How to show aggregated CPU, RAM, Disk I/O usage of a cluster using Prometheus?

grafana

prometheus

prometheus-node-exporter