Google云监控:添加发布成功订阅失败告警
Google Cloud Monitoring: Add an alert if Publish succeeds and subscribe fails
我想在 Google Cloud Monitoring 上添加警报,这样,对于给定的主题和订阅,我想知道主题是否正在发布,然后订阅不会同时被确认或给定时间范围内的相似比率。
我们如何使用 Google Cloud Monitoring 或 StackDriver 中的 Alerts 实现这一点?
我尝试了一种方法,我需要满足两个条件:
- 如果发布操作 > 0.016/秒持续 2 分钟(意味着至少一个
每分钟发布)
- 如果订阅确认 < 0.001/sec 持续 2 分钟(如果没有订阅确认在 2 分钟内发生)
然后,警报。
这里发生的事情是,在低负载期间,如果在 3 分钟内没有发布发生并且发生了发布,则条件 1 和 2 都设置为 true 并且开发人员会收到有关此失败的警报.
那么,设计此类警报的正确方法是什么?
如果我的方法接近我想要的,我想到的下一个问题是,
- 有没有办法说从实例开始计算你的两分钟
发布碰巧看到确认条件是否为
满意不满意
- 或者,有没有办法让警报等待 2-3 分钟以查看事件是否解决,然后向开发人员发送警报。
- 或者,有没有一种方法可以计算满足这些条件的次数,然后仅当在 15 分钟或类似时间段内出现次数超过 5 次或 10 次时才发出警报。
抱歉这么久了 post。但是,我们将不胜感激任何形式的帮助。
为了计算任务的频率,使用了 2-3 分钟的时间 window。因此,如果您在 2 分钟或更长时间内有 0 个任务,则会再次出现此问题。关于 partial metrics 的文档对此进行了描述。此外,此 link.
中也有解决方法
您可以尝试创建自己的 custom metrics。
我想在 Google Cloud Monitoring 上添加警报,这样,对于给定的主题和订阅,我想知道主题是否正在发布,然后订阅不会同时被确认或给定时间范围内的相似比率。
我们如何使用 Google Cloud Monitoring 或 StackDriver 中的 Alerts 实现这一点?
我尝试了一种方法,我需要满足两个条件:
- 如果发布操作 > 0.016/秒持续 2 分钟(意味着至少一个 每分钟发布)
- 如果订阅确认 < 0.001/sec 持续 2 分钟(如果没有订阅确认在 2 分钟内发生)
然后,警报。
这里发生的事情是,在低负载期间,如果在 3 分钟内没有发布发生并且发生了发布,则条件 1 和 2 都设置为 true 并且开发人员会收到有关此失败的警报.
那么,设计此类警报的正确方法是什么?
如果我的方法接近我想要的,我想到的下一个问题是,
- 有没有办法说从实例开始计算你的两分钟 发布碰巧看到确认条件是否为 满意不满意
- 或者,有没有办法让警报等待 2-3 分钟以查看事件是否解决,然后向开发人员发送警报。
- 或者,有没有一种方法可以计算满足这些条件的次数,然后仅当在 15 分钟或类似时间段内出现次数超过 5 次或 10 次时才发出警报。
抱歉这么久了 post。但是,我们将不胜感激任何形式的帮助。
为了计算任务的频率,使用了 2-3 分钟的时间 window。因此,如果您在 2 分钟或更长时间内有 0 个任务,则会再次出现此问题。关于 partial metrics 的文档对此进行了描述。此外,此 link.
中也有解决方法您可以尝试创建自己的 custom metrics。