zabbix中相同的触发警报停止
same trigger alert stop in zabbix
我正在使用 Zabbix 3.2;我已经为所有触发器配置了邮件警报操作。我的问题是,
说触发 (A) 警报(问题事件)升级,几分钟后 returns 变为正常(Ok 事件警报)。如果在接下来的几分钟内发生相同的 'A' 触发器,我需要停止警报。怎么可能?
我试过这个文档;
https://www.zabbix.com/documentation/3.2/manual/config/notifications/action/escalations
问题似乎是关于防止触发器摆动。一般来说,建议三种方法:
- 使用 trigger functions - 例如,使用
avg(15m)
而不是 last()
- 然后只有在 15 分钟的平均值超过阈值后才会发出警报。其他有用的触发函数可能是 min()
和 max()
- 使用滞后 - 这使得触发器在一个阈值处触发但在另一个阈值处解析。在 Zabbix 3.2 之前完成 in the trigger expression; since Zabbix 3.2 there is a separate "recovery" field
- 使用 action escalations 一开始什么都不做,只有在问题已经存在一段时间后才发送警报 - 例如,在第二步或第三步发出警报
这三种方法都实现了相似的结果,但主要区别在于:
- 第一种方法 - 触发器函数 - 使触发器稍后触发,但减少了事件数量(触发器触发的次数)
- 第二种方法 - 滞后 - 使触发器与 "flappy" 触发器同时触发,但会延迟恢复事件。它还减少了事件的数量(触发触发的次数)
- 第三种方法-延迟升级步骤-完全不影响触发器,它可以一直拍打。不过,它只会在问题存在时间较长时发出警报。
滞后通常会在触发器拍打时发出警报;延迟升级步骤将忽略短期问题。
就复杂性而言,我通常会选择第一种方法 - 它最容易配置,最难错误配置,也最容易理解。如果我特别需要它们使 events/alerts 行为的方式,我会选择其他两种方法中的一种 - 这些方法更容易被错误配置或误解。
请注意,评论中的项键引用是错误的 - 主机与键之间用冒号分隔,缺少完整的键名且参数错误。有关正确的键语法,请参阅手册中的 the agent key page。
我正在使用 Zabbix 3.2;我已经为所有触发器配置了邮件警报操作。我的问题是, 说触发 (A) 警报(问题事件)升级,几分钟后 returns 变为正常(Ok 事件警报)。如果在接下来的几分钟内发生相同的 'A' 触发器,我需要停止警报。怎么可能? 我试过这个文档; https://www.zabbix.com/documentation/3.2/manual/config/notifications/action/escalations
问题似乎是关于防止触发器摆动。一般来说,建议三种方法:
- 使用 trigger functions - 例如,使用
avg(15m)
而不是last()
- 然后只有在 15 分钟的平均值超过阈值后才会发出警报。其他有用的触发函数可能是min()
和max()
- 使用滞后 - 这使得触发器在一个阈值处触发但在另一个阈值处解析。在 Zabbix 3.2 之前完成 in the trigger expression; since Zabbix 3.2 there is a separate "recovery" field
- 使用 action escalations 一开始什么都不做,只有在问题已经存在一段时间后才发送警报 - 例如,在第二步或第三步发出警报
这三种方法都实现了相似的结果,但主要区别在于:
- 第一种方法 - 触发器函数 - 使触发器稍后触发,但减少了事件数量(触发器触发的次数)
- 第二种方法 - 滞后 - 使触发器与 "flappy" 触发器同时触发,但会延迟恢复事件。它还减少了事件的数量(触发触发的次数)
- 第三种方法-延迟升级步骤-完全不影响触发器,它可以一直拍打。不过,它只会在问题存在时间较长时发出警报。
滞后通常会在触发器拍打时发出警报;延迟升级步骤将忽略短期问题。
就复杂性而言,我通常会选择第一种方法 - 它最容易配置,最难错误配置,也最容易理解。如果我特别需要它们使 events/alerts 行为的方式,我会选择其他两种方法中的一种 - 这些方法更容易被错误配置或误解。
请注意,评论中的项键引用是错误的 - 主机与键之间用冒号分隔,缺少完整的键名且参数错误。有关正确的键语法,请参阅手册中的 the agent key page。