nagios.log 格式 - 字段定义
nagios.log format - field definition
我已经找了一个多小时了。我以为我在这里看到了什么,但我找不到了。
我正在寻找 nagios.log 的记录定义。具体来说,我想弄清楚这个数字代表什么。在这篇文章中,我想了解“1”是什么。
[1549377065] 服务警报:esgg;HTTP;严重;软;1;严重 - 套接字超时
我原以为这很容易找到,但我错了,或者只是迷路了。
与Nagios中的soft&hard机制有关
例如,如果您的服务 esgg
在您的服务定义中设置了 max_check_attempts 3
,那么您将看到如下内容:
[1549377065] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;1;CRITICAL - Socket timeout
[1549377195] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;2;CRITICAL - Socket timeout
[1549377265] SERVICE ALERT: esgg;HTTP;CRITICAL;HARD;3;CRITICAL - Socket timeout
您需要连续检查 3 次错误才能获得 HARD 状态和通知。
在 Nagios 服务定义中,您设置了 "check interval"、"retry interval" 和 "max check attempts"。换句话说,nagios 将每 check interval
分钟检查一次服务,然后如果不正常,它将每 retry interval
分钟再次检查一次,检查一次 max check attempts
次。您指的是自服务进入 "non OK" 状态以来 Nagios 检查该服务的次数。它会递增,直到达到 max check attempts
或返回到 OK 状态。
我已经找了一个多小时了。我以为我在这里看到了什么,但我找不到了。
我正在寻找 nagios.log 的记录定义。具体来说,我想弄清楚这个数字代表什么。在这篇文章中,我想了解“1”是什么。
[1549377065] 服务警报:esgg;HTTP;严重;软;1;严重 - 套接字超时
我原以为这很容易找到,但我错了,或者只是迷路了。
与Nagios中的soft&hard机制有关
例如,如果您的服务 esgg
在您的服务定义中设置了 max_check_attempts 3
,那么您将看到如下内容:
[1549377065] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;1;CRITICAL - Socket timeout
[1549377195] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;2;CRITICAL - Socket timeout
[1549377265] SERVICE ALERT: esgg;HTTP;CRITICAL;HARD;3;CRITICAL - Socket timeout
您需要连续检查 3 次错误才能获得 HARD 状态和通知。
在 Nagios 服务定义中,您设置了 "check interval"、"retry interval" 和 "max check attempts"。换句话说,nagios 将每 check interval
分钟检查一次服务,然后如果不正常,它将每 retry interval
分钟再次检查一次,检查一次 max check attempts
次。您指的是自服务进入 "non OK" 状态以来 Nagios 检查该服务的次数。它会递增,直到达到 max check attempts
或返回到 OK 状态。