如何使用 Prometheus 显示集群的聚合 CPU、RAM、磁盘 I/O 使用情况?

How to show aggregated CPU, RAM, Disk I/O usage of a cluster using Prometheus?

我有 3 个服务器。我将 Prometheus 与 Node exporter 结合使用,为了可视化 Prometheus 数据,我使用了 Grafana。 Node Exporter Full (1860) 仪表板只能单独显示每个服务器的 CPU、RAM、磁盘 I/O 使用情况。我想获得总体使用情况,例如,我想获得整个集群的 (sarver1 + sarver2 + sarver3) 聚合 CPU、RAM 和磁盘 I/O 使用情况。我应该使用什么查询来获取集群资源的总利用率?

假设您有以下查询来获取 CPU 用法:

100 - (avg(irate(node_cpu_seconds_total{instance="server1",mode="idle"}[5m])) * 100)

要获取多个服务器的总和,您需要将查询更改为以下内容:

100 - (avg(irate(node_cpu_seconds_total{instance=~"server1|server2|server3",mode="idle"}[5m])) * 100)