应用程序指标会发生什么,例如CPU 由未在抓取间隔 prometheus 中抓取的进程使用

what happens to application metrics e.g. CPU used by process that are not scraped in scrape interval prometheus

prometheus 如何在不抓取的时间间隔内收集 CPU 信息?例如我有我的 scrape_interval: 15s 和一个 CPU 在普罗米修斯没有抓取的 15 秒内峰值高达 90% ... 我会丢失这个重要信息被聚合到平均 CPU 使用我的过程指标 rate(process_cpu_system_seconds_total[15s]) * 100 ?

我只需要了解,如果抓取间隔为 n 秒,那么这 n 秒的监控数据将被收集还是只是丢失?

它没有“丢失”,但你说得对,它从未被观测到。

几乎所有测量值都会因这种必要的近似值或 down sampling.

而出现误差

结果是任何测量计算几乎总是只与捕获的数据一样好。

当采样数据被进一步“采样”以最小化存储时,问题会加剧,例如仅保留上个月之后的每日数据。

例如假设以下是一些测量的完美记录:

1,2,1,9,1,4,1,1,1,9

如果采样每隔一个值检索一次:

1,1,1,1,1

这几乎完全不能代表数据

平均:1 对 3

p90: 1 对 9