普罗米修斯在推送网关重启时计数和求和指标
Prometheus count and sum metric over restart of pushgateway
我想统计用户在前端打开对话框并将结果发送到 prometheus pushgateway 的频率。
问题是一旦网关重新启动,指标就消失了,我无法正确求和这些值。
速率函数似乎不适合这个目的。
是否有可能随着时间的推移求和,无论是否重启?
这是总和查询,但显示的结果与我预期的不同。
如果我将它们分组,也许 sum_over_time 可以做到,但如果我添加 by 子句,它会抛出错误。
您可能正在寻找 increase
,而不是 rate
。与 rate * <interval_length_in_seconds>
.
相同
附带说明一下,理论上 Pushgateway 会在重启后保持其状态,但如果您 运行 它在 Docker 或 Kubernetes 中,您需要设置一个持久卷以供使用通过您连续的 Pushgateway 实例。
我想统计用户在前端打开对话框并将结果发送到 prometheus pushgateway 的频率。
问题是一旦网关重新启动,指标就消失了,我无法正确求和这些值。
速率函数似乎不适合这个目的。
是否有可能随着时间的推移求和,无论是否重启?
这是总和查询,但显示的结果与我预期的不同。
也许 sum_over_time 可以做到,但如果我添加 by 子句,它会抛出错误。
您可能正在寻找 increase
,而不是 rate
。与 rate * <interval_length_in_seconds>
.
附带说明一下,理论上 Pushgateway 会在重启后保持其状态,但如果您 运行 它在 Docker 或 Kubernetes 中,您需要设置一个持久卷以供使用通过您连续的 Pushgateway 实例。