如何教 Zabbix 聪明地处理事件中的短峰值?

How to teach Zabbix to be smart about short spikes in events?

最近我开始收到来自 Zabbix 的关于我们其中一台服务器的高 iowait 的警报。此事件是由 pg_dump 备份我们的数据库引起的,这完全没问题,因为尖峰很短而且...好吧,因为在服务器上备份是合法的 activity。

有没有办法教 Zabbix 聪明地处理这些事情?我认为没有必要每天发送有关 iowait 短暂(<30 秒)峰值的电子邮件警报。另一方面,如果服务器日充满了 5 秒的峰值,则应对此进行调查。

最流行和最简单的方法是使用适当的触发器功能。例如,不要使用您最可能使用的 last(),而是选择 min(60)avg(60)。最小值不会检测到重复尖峰,平均可能。

其他可能有用的 trigger functions 用于此目的:

  • regexp()(主要用于文本项)
  • str()(主要用于文本项)
  • count()

注意 last() 不能 return 或计算多个值,因此 last() = last(0) = last(300).