具有相关字段但标签不同的 promql 示例

promql example with related fields but different labels

我正在使用 Prometheus 和 Grafana,我正在尝试跟踪 Web 服务器应用程序。

我想绘制特定查询的平均持续时间(以毫秒为单位)。我想我可以从下面的数据中得到,但我正在努力。

我的两组价值观:

rate(http_server_request_duration_seconds_sum[5m])

Element Value
{instance="dbserver:5000",job="control-tower",method="get",path="/api/control/v1/node/config.json"} 0.0010491088980113385
{instance="dbserver:5000",job="control-tower",method="get",path="/api/schedule/v1/programs/:id.json"}   0
{instance="dbserver:5000",job="control-tower",method="get",path="/api/schedule/v1/users.json"}  0
{instance="dbserver:5000",job="control-tower",method="get",path="/metrics"} 0.00009133616130826839
{instance="dbserver:5000",job="control-tower",method="post",path="/api/caption/v1/messages.json"}   0
{instance="dbserver:5000",job="control-tower",method="post",path="/api/caption/v1/sessions.json"}   0
{instance="dbserver:5000",job="control-tower",method="post",path="/api/schedule/v1/programs.json"}  0
{instance="dbserver:5000",job="control-tower",method="put",path="/api/caption/v1/sessions/captioners.json"} 0
{instance="dbserver:5000",job="control-tower",method="put",path="/api/control/v1/agents/:id.json"}


rate(http_server_requests_total[5m])

Element Value
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="get",path="/api/control/v1/node/config.json"} 0.03511075688258612
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="get",path="/api/schedule/v1/programs/:id.json"}   0
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="get",path="/api/schedule/v1/users.json"}  0
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="get",path="/metrics"} 0.06671043807691363
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="post",path="/api/caption/v1/sessions.json"}   0
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="post",path="/api/schedule/v1/programs.json"}  0
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="put",path="/api/caption/v1/sessions/captioners.json"} 0
{code="200",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="put",path="/api/control/v1/agents/:id.json"}  0
{code="422",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="post",path="/api/schedule/v1/programs.json"}  0
{code="502",host="dbserver:5000",instance="dbserver:5000",job="control-tower",method="post",path="/api/caption/v1/messages.json"}

它们有不同的标签。为此,我只关心 where path="/api/caption/v1/messages.json".

我想我需要使用 rate、sum 和 "on" 或 "ignore" 的组合,但我一直无法继续或忽略工作。

我可以通过以下方式获得分子(以秒为单位):

rate( http_server_request_duration_seconds_sum { path="/api/caption/v1/messages.json" }[5m])

还有 returns:

{instance="dbserver:5000", job="control-tower", method="post", path="/api/caption/v1/messages.json"}    

但是分母可以有不同的 return 代码,所以我必须对它们求和,我需要做一些 ignore 或 on 之类的,但我还没有找到一个可以帮助我的例子,我真的很陌生。

有人吗?

好吧,我继续玩。因为我只担心一条路,所以我想我可以对这些比率求和。我认为这可行:

sum( rate( http_server_request_duration_seconds_sum {path="/api/caption/v1/messages.json"}[2h])) / sum( rate( http_server_requests_total{ path="/api/caption/v1/messages.json"}[2h]))

我更改了采样率,因为我的样本数据在我的 5 分钟内下降 window,我得到了零。

我认为这是在对费率求和,从而消除所有标签。我认为它也在做的是使用 2 小时的数据。我认为速率值是该值在 2 小时内变化的速度。

我喜欢评论。

如果我想让一个图表包含其他路径,这个解决方案将不起作用,而且我仍然不确定该怎么做,所以这解决了我当前的问题,但仍然没有帮助我弄清楚如何使用 ignore 或 on 做类似的事情。