普罗米修斯在推送网关重启时计数和求和指标

Prometheus count and sum metric over restart of pushgateway

我想统计用户在前端打开对话框并将结果发送到 prometheus pushgateway 的频率。

问题是一旦网关重新启动,指标就消失了,我无法正确求和这些值。

速率函数似乎不适合这个目的。

是否有可能随着时间的推移求和,无论是否重启?

这是总和查询,但显示的结果与我预期的不同。

如果我将它们分组,

也许 sum_over_time 可以做到,但如果我添加 by 子句,它会抛出错误。

您可能正在寻找 increase,而不是 rate。与 rate * <interval_length_in_seconds>.

相同

附带说明一下,理论上 Pushgateway 会在重启后保持其状态,但如果您 运行 它在 Docker 或 Kubernetes 中,您需要设置一个持久卷以供使用通过您连续的 Pushgateway 实例。