Azure Application Insights 警报仅工作一次
Azure Application Insights Alerts work only once
我正在测试 Azure Application Insights 警报功能。好像有bug或者不知道怎么用
如果我根据指标 'Server Exceptions' 创建一个新警报,它似乎只工作一次就再也不会工作了。一旦触发,它似乎会进入 'Active' 状态,其中有一个带有 ! 的橙色三角形。请参见下图。我创建了一个新的,我还没有触发,如图所示,它有一个带勾号的绿色圆圈。
这对我来说意味着警报不会再次触发,直到 'acknowledges' 警报,这不是一个坏主意,但我不知道该怎么做。
编辑:
我刚刚尝试按照建议使用 'Exception Rate',但我认为触发警报的最低阈值是在 5 分钟内平均每秒 1 次异常。
我必须说我的用例没有得到处理似乎很奇怪。我有一个轻量级 Web API 服务,它非常简单,它永远不会失败,但它可能会失败,因此,如果发生异常,我想立即收到警报。
当警报条件不再满足时,警报应该会解决并且状态应该会恢复为绿色。
使用 "Count" 指标很难实现这一点,因为它们不断上升,几乎从不下降。这意味着,一旦触发,警报将不会解决,因为指标的值始终保持在阈值以上。
您可以尝试在 "Rate" 指标上设置警报,当 "Rate" 在您设置的限制范围内时,您应该会看到状态恢复为绿色。
此问题现已修复。如果您发现任何问题,请告诉我们。一些注意事项:
- 警报规则是根据滑动 window 评估的:警报将 trigger/resolve 基于从样本到达的那一刻起滑动 window 条件的评估方式。
- 以上针对基于异常计数的警报规则的警告:如果在规则中配置的时间 window 内没有异常报告,我们将解决警报。
- 注意:这与基于指标的规则不同——缺少数据不会导致为这些规则解决警报。
"Server exception" 指标在 2018 年按 OP 预期的方式工作。我的用例如下:
For the goal of getting an email whenever an Exception happened.
使用 "Server exception" 指标。
如果错误没有再次发生,该指标足够智能,可以在初始警报后等待一段时间后自动解决。
因此您将拥有初始 "Alert",然后 5 分钟后没有异常,它 returns 进入 "Healthy" 状态。
并且由于它是自动解决的,如果明天再次发生错误,它将再次执行 "Alert"。
请注意,这是将 App Insights 与 Function App 结合使用。 Function App Failure 指标有问题并且对此不可靠(Azure 保持记录 0.2 Exception/s 并认为这超过了 5 分钟阈值中的 1...)
我正在测试 Azure Application Insights 警报功能。好像有bug或者不知道怎么用
如果我根据指标 'Server Exceptions' 创建一个新警报,它似乎只工作一次就再也不会工作了。一旦触发,它似乎会进入 'Active' 状态,其中有一个带有 ! 的橙色三角形。请参见下图。我创建了一个新的,我还没有触发,如图所示,它有一个带勾号的绿色圆圈。
这对我来说意味着警报不会再次触发,直到 'acknowledges' 警报,这不是一个坏主意,但我不知道该怎么做。
编辑:
我刚刚尝试按照建议使用 'Exception Rate',但我认为触发警报的最低阈值是在 5 分钟内平均每秒 1 次异常。
我必须说我的用例没有得到处理似乎很奇怪。我有一个轻量级 Web API 服务,它非常简单,它永远不会失败,但它可能会失败,因此,如果发生异常,我想立即收到警报。
当警报条件不再满足时,警报应该会解决并且状态应该会恢复为绿色。 使用 "Count" 指标很难实现这一点,因为它们不断上升,几乎从不下降。这意味着,一旦触发,警报将不会解决,因为指标的值始终保持在阈值以上。
您可以尝试在 "Rate" 指标上设置警报,当 "Rate" 在您设置的限制范围内时,您应该会看到状态恢复为绿色。
此问题现已修复。如果您发现任何问题,请告诉我们。一些注意事项:
- 警报规则是根据滑动 window 评估的:警报将 trigger/resolve 基于从样本到达的那一刻起滑动 window 条件的评估方式。
- 以上针对基于异常计数的警报规则的警告:如果在规则中配置的时间 window 内没有异常报告,我们将解决警报。
- 注意:这与基于指标的规则不同——缺少数据不会导致为这些规则解决警报。
"Server exception" 指标在 2018 年按 OP 预期的方式工作。我的用例如下:
For the goal of getting an email whenever an Exception happened.
使用 "Server exception" 指标。
如果错误没有再次发生,该指标足够智能,可以在初始警报后等待一段时间后自动解决。
因此您将拥有初始 "Alert",然后 5 分钟后没有异常,它 returns 进入 "Healthy" 状态。
并且由于它是自动解决的,如果明天再次发生错误,它将再次执行 "Alert"。
请注意,这是将 App Insights 与 Function App 结合使用。 Function App Failure 指标有问题并且对此不可靠(Azure 保持记录 0.2 Exception/s 并认为这超过了 5 分钟阈值中的 1...)