Nagios - 如何处理预期的非正常状态?
Nagios - How to Handle Expected Non-OK Statuses?
每 night/morning 大约 1:00 上午,服务器运行其每日备份。在此期间,CPU-使用率高于 WARNING/CRITICAL 水平是正常的,而备份是 运行。但是,我每天都在这段时间收到问题和恢复通知...
由于这段时间应该考虑"normal"高CPU,那么处理这种情况的最佳方法是什么?
我会为此使用 "notification_period" 之类的东西吗?
我在想,如果 1:00 和 2:00 之间此主机的 CPU 很高,那么 ignore/don 不会在此期间发送通知。如果 2:00 后服务状态不正常,则发送通知...
如有任何想法或建议,我们将不胜感激!
最好的解决方案可能是在您的服务定义中使用 check_period 指令,因为 Nagios 没有 机器学习 之类的东西.
我建议您在日常备份期间禁用此服务的主动检查。
时间段的配置示例:
define timeperiod{
timeperiod_name 24X7custom
alias 24X7custom
sunday 00:00-01:00,02:01-23:59
monday 00:00-01:00,02:01-23:59
tuesday 00:00-01:00,02:01-23:59
wednesday 00:00-01:00,02:01-23:59
thursday 00:00-01:00,02:01-23:59
friday 00:00-01:00,02:01-23:59
saturday 00:00-01:00,02:01-23:59
}
每 night/morning 大约 1:00 上午,服务器运行其每日备份。在此期间,CPU-使用率高于 WARNING/CRITICAL 水平是正常的,而备份是 运行。但是,我每天都在这段时间收到问题和恢复通知...
由于这段时间应该考虑"normal"高CPU,那么处理这种情况的最佳方法是什么?
我会为此使用 "notification_period" 之类的东西吗?
我在想,如果 1:00 和 2:00 之间此主机的 CPU 很高,那么 ignore/don 不会在此期间发送通知。如果 2:00 后服务状态不正常,则发送通知...
如有任何想法或建议,我们将不胜感激!
最好的解决方案可能是在您的服务定义中使用 check_period 指令,因为 Nagios 没有 机器学习 之类的东西.
我建议您在日常备份期间禁用此服务的主动检查。
时间段的配置示例:
define timeperiod{
timeperiod_name 24X7custom
alias 24X7custom
sunday 00:00-01:00,02:01-23:59
monday 00:00-01:00,02:01-23:59
tuesday 00:00-01:00,02:01-23:59
wednesday 00:00-01:00,02:01-23:59
thursday 00:00-01:00,02:01-23:59
friday 00:00-01:00,02:01-23:59
saturday 00:00-01:00,02:01-23:59
}