Prometheus 提醒第一个计数器值

Prometheus alerts first counter value

我正在尝试创建错误警报。有一个统计应用程序中发生的错误的指标。但是当我试图抓住它的增长时,它总是 returns 0.

increase(app_error[1h])

即使我用偏移offset 5h来做,到第一次遇到它的时候,它就消失了。有没有办法找到第一个错误遇到及其第一个值增加(从 0 到 1)?我只需要在第一次计数该指标时触发警报。

简答:否

长答案:不,但是您可以通过在代码中声明相应指标时将指标初始化为 0 来绕过此限制。也许还有其他我现在想不到的解决方案。

原因是您的指标 app_error 只有在 Prometheus 第一次递增后才开始“存在”。因此increase会给你增加0(从无到1就是...0)。

解决了

app_error unless app_error offset 1h

return 表达式左侧 unless 表达式右侧没有匹配项。