如何教 Zabbix 聪明地处理事件中的短峰值?
How to teach Zabbix to be smart about short spikes in events?
最近我开始收到来自 Zabbix 的关于我们其中一台服务器的高 iowait 的警报。此事件是由 pg_dump 备份我们的数据库引起的,这完全没问题,因为尖峰很短而且...好吧,因为在服务器上备份是合法的 activity。
有没有办法教 Zabbix 聪明地处理这些事情?我认为没有必要每天发送有关 iowait 短暂(<30 秒)峰值的电子邮件警报。另一方面,如果服务器日充满了 5 秒的峰值,则应对此进行调查。
最流行和最简单的方法是使用适当的触发器功能。例如,不要使用您最可能使用的 last()
,而是选择 min(60)
或 avg(60)
。最小值不会检测到重复尖峰,平均可能。
其他可能有用的 trigger functions 用于此目的:
regexp()
(主要用于文本项)
str()
(主要用于文本项)
count()
注意 last()
不能 return 或计算多个值,因此 last()
= last(0)
= last(300)
.
最近我开始收到来自 Zabbix 的关于我们其中一台服务器的高 iowait 的警报。此事件是由 pg_dump 备份我们的数据库引起的,这完全没问题,因为尖峰很短而且...好吧,因为在服务器上备份是合法的 activity。
有没有办法教 Zabbix 聪明地处理这些事情?我认为没有必要每天发送有关 iowait 短暂(<30 秒)峰值的电子邮件警报。另一方面,如果服务器日充满了 5 秒的峰值,则应对此进行调查。
最流行和最简单的方法是使用适当的触发器功能。例如,不要使用您最可能使用的 last()
,而是选择 min(60)
或 avg(60)
。最小值不会检测到重复尖峰,平均可能。
其他可能有用的 trigger functions 用于此目的:
regexp()
(主要用于文本项)str()
(主要用于文本项)count()
注意 last()
不能 return 或计算多个值,因此 last()
= last(0)
= last(300)
.